Pasek boczny

pl:statpqpl:porown2grpl:parpl

Testy parametryczne

Test Fishera-Snedecora

Test Fishera-Snedecora (ang. F-Snedecor test) opiera się na zmiennej $F$ sformułowanej przez Fishera (1924), a jej rozkład opisał Snedecor. Test ten służy do weryfikacji hipotezy o równości wariancji badanej zmiennej w dwóch populacjach.

Podstawowe warunki stosowania:

Hipotezy:

\begin{array}{cc}
\mathcal{H}_0: & \sigma_1^2=\sigma_2^2,\\
\mathcal{H}_1: & \sigma_1^2\ne\sigma_2^2,
\end{array}

gdzie:

$\sigma_1^2$, $\sigma_2^2$ $-$ wariancje badanej zmiennej w pierwszej i drugiej populacji.

Statystyka testowa ma postać: \begin{displaymath}
F=\displaystyle{\frac{sd_1^2}{sd_2^2}},
\end{displaymath}

gdzie:

$sd_1^2$, $sd_2^2$ $-$ wariancje badanej zmiennej w próbach wybranych losowo z pierwszej i drugiej populacji.

Statystyka ta podlega rozkładowi F Snedecora z $n_1-1$ i $n_2-1$ stopniami swobody.

Wyznaczoną na podstawie statystyki testowej wartość $p$ porównujemy z poziomem istotności poziomem istotności $\alpha$:

\begin{array}{ccl}
$ jeżeli $ p \le \alpha & \Longrightarrow & $ odrzucamy $ \mathcal{H}_0 $ przyjmując $ 	\mathcal{H}_1, \\
$ jeżeli $ p > \alpha & \Longrightarrow & $ nie ma podstaw, aby odrzucić $ \mathcal{H}_0. \\
\end{array}

Okno z ustawieniami opcji testu F Fishera-Snedecora wywołujemy poprzez menu StatystykaTesty parametryczneF Fisher Snedecor.

Uwaga!

Obliczenia mogą bazować na danych w postaci surowych rekordów lub danych uśrednionych tzn. odchyleniach standardowych i liczności prób.

2014/08/22 20:00

Test t-Studenta dla grup niezależnych

Test $t$-Studenta dla grup niezależnych (ang. t test for independent groups) służy do weryfikacji hipotezy o równości średnich badanej zmiennej w dwóch populacjach.

Podstawowe warunki stosowania:

Hipotezy:

\begin{array}{cc}
\mathcal{H}_0: & \mu_1=\mu_2,\\
\mathcal{H}_1: & \mu_1\ne\mu_2.
\end{array}

gdzie:

$\mu_1$, $\mu_2$ $-$ średnie badanej zmiennej w pierwszej i drugiej populacji.

Statystyka testowa ma postać:

\begin{displaymath}
t=\frac{\displaystyle{\overline{x}_1-\overline{x}_2}}{\displaystyle{\sqrt{\frac{(n_1-1)sd_1^2+(n_2-1)sd_2^2}{n_1+n_2-2}\left(\frac{1}{n_1}+\frac{1}{n_2}\right)}}},
\end{displaymath}

gdzie:

$\overline{x}_1, \overline{x}_2 $ $-$ średnie w pierwszej i drugiej próbie,

$n_1, n_2 $ $-$ liczności w pierwszej i drugiej próbie,

$sd_1^2, sd_2^2 $ $-$ wariancje w pierwszej i drugiej próbie.

Statystyka testowa ma rozkład t-Studenta z $df=n_1+n_2-2$ stopniami swobody.

Wyznaczoną na podstawie statystyki testowej wartość $p$ porównujemy z poziomem istotności $\alpha$ :

\begin{array}{ccl}
$ jeżeli $ p \le \alpha & \Longrightarrow & $ odrzucamy $ \mathcal{H}_0 $ przyjmując $ 	\mathcal{H}_1, \\
$ jeżeli $ p > \alpha & \Longrightarrow & $ nie ma podstaw, aby odrzucić $ \mathcal{H}_0. \\
\end{array}

Uwaga!

  • wspólne odchylenie standardowe wyraża się wzorem:

\begin{displaymath}
SD_p=\sqrt{\frac{(n_1-1)sd_1^2+(n_2-1)sd_2^2}{n_1+n_2-2}},
\end{displaymath}

  • błąd standardowy różnicy średnich wyraża się wzorem:

\begin{displaymath}
SE_{\overline{x}_1-\overline{x}_2}=\displaystyle{\sqrt{\frac{(n_1-1)sd_1^2+(n_2-1)sd_2^2}{n_1+n_2-2}\left(\frac{1}{n_1}+\frac{1}{n_2}\right)}}.
\end{displaymath}

Standaryzowana wielkość efektu

Współczynnik d-Cohena określa jak dużą częścią występującej zmienności jest różnica między średnimi.

\begin{displaymath}
	d=\left|\frac{\overline{x}_1-\overline{x}_2}{SD_p}\right|
\end{displaymath}

Przy interpretacji efektu badacze często posługują się ogólnymi, określonymi przez Cohena 1) wskazówkami definiującymi małą (0.2), średnią (0.5) i dużą (0.8) wielkość efektu.

Okno z ustawieniami opcji testu t-Studenta dla grup niezależnych wywołujemy poprzez menu StatystykaTesty parametrycznet-Student dla grup niezależnych lub poprzez ''Kreator''.

Gdy w oknie testu w opcji dotyczącej wariancji wybierzemy:

  • równe, wówczas zostanie wyliczony test $t$-Studenta dla grup niezależnych,
  • różne, wówczas zostanie wyliczony test $t$-Studenta z korektą Cochrana-Coxa,
  • sprawdź równość, wówczas zostanie wyliczony test Fishera-Snedecora a na podstawie jego wyniku i ustawionego poziomu istotności zostanie wybrany i wyliczony test t-Studenta dla grup niezależnych z bądź bez poprawki Cochrana-Coxa.

Uwaga!

Obliczenia mogą bazować na danych w postaci surowych rekordów lub danych uśrednionych tzn. średnich arytmetycznych, odchyleniach standardowych i liczności prób.

Przykład (plik choloesterol.pqs)

Z populacji kobiet i z populacji mężczyzn w wieku powyżej 40 roku życia wylosowano po 500 osób. Badanie dotyczyło oceny ryzyka chorób sercowo-naczyniowych. Wśród badanych parametrów znajduje się wartość cholesterolu całkowitego. Celem tego badania będzie porównanie mężczyzn i kobiet co do tej wartości. Chcemy bowiem wykazać, że te populacje różnią się już na poziomie cholesterolu całkowitego a nie tylko w obrębie cholesterolu rozbitego na frakcje.

Rozkład poziomu cholesterolu całkowitego w obu populacjach jest rozkładem normalnym (zostało to sprawdzone testem Lillieforsa). Średnia wartość cholesterolu w grupie mężczyzn wyniosła $\overline{x}_1=201.1$ a odchylenie standardowe $sd_1=47.6$, w grupie kobiet odpowiednio $\overline{x}_2=191.5$ i $sd_2=43.5$. Test Fishera-Snedecora wskazuje na niewielkie lecz istotne statystycznie ($p=0.0434$) różnice w wariancjach. W analizie zastosowany zostanie test t-Studenta z poprawką Cochrana-Coxa.

Hipotezy:


$
\begin{array}{cl}
\mathcal{H}_0: & $średni cholesterol całkowity populacji kobiet jest równy$\\
&$średniemu cholesterolowi całkowitemu populacji mężczyzn,$\\
\mathcal{H}_1: & $średni cholesterol całkowity populacji kobiet jest różny$ \\
&$od średniego cholesterolu całkowitego populacji mężczyzn.$
\end{array}
$

Porównując wartość $p=0.0009$ z poziomem istotności $\alpha=0.05$ stwierdzamy, że kobiety i mężczyźni w Polsce różnią się istotnie statystycznie wartością cholesterolu całkowitego. Przeciętny Polak, który ukończył 40 rok życia ma wyższy cholesterol całkowity od przeciętnej Polki prawie o 10 jednostek.

2014/08/22 20:00

Test t-Studenta z korektą Cochrana-Coxa

Poprawka Cochrana-Coxa dotyczy testu t-Studenta dla grup niezależnych (ang. Cochran-Cox adjustment), (1957)2) i jest wyliczana wówczas, gdy wariancje badanych zmiennych w obu populacjach są różne.

Statystyka testowa ma postać:

\begin{displaymath}
t=\frac{\overline{x}_1-\overline{x}_2}{\sqrt{\frac{sd_1^2}{n_1}+\frac{sd_2^2}{n_2}}}.
\end{displaymath}

Statystyka testowa ma rozkład t-Studenta z liczbą stopni swobody zaproponowaną przez Satterthwaite (1946)3) i wyliczaną z wzoru:

\begin{displaymath}
df=\frac{\left( \frac{sd_1^2}{n_1}+\frac{sd_2^2}{n_2}\right)^2}{\left( \frac{sd_1^2}{n_1}\right)^2\cdot \frac{1}{(n_1-1)}+\left( \frac{sd_2^2}{n_2}\right)^2\cdot \frac{1}{(n_2-1)}}.
\end{displaymath}

Okno z ustawieniami opcji testu t-Studenta dla grup niezależnych wywołujemy poprzez menu StatystykaTesty parametrycznet-Student dla grup niezależnych lub poprzez ''Kreator''.

Gdy w oknie testu w opcji dotyczącej wariancji wybierzemy:

  • równe, wówczas zostanie wyliczony test $t$-Studenta dla grup niezależnych,
  • różne, wówczas zostanie wyliczony test $t$-Studenta z korektą Cochrana-Coxa,
  • sprawdź równość, wówczas zostanie wyliczony test Fishera-Snedecora a na podstawie jego wyniku i ustawionego poziomu istotności zostanie wybrany i wyliczony test $t$-Studenta dla grup niezależnych z bądź bez poprawki Cochrana-Coxa.

Uwaga!

Obliczenia mogą bazować na danych w postaci surowych rekordów lub danych uśrednionych tzn. średnich arytmetycznych, odchyleniach standardowych i liczności prób.

2014/08/22 20:00

Test t-Studenta dla grup zależnych

Test t-Studenta dla grup zależnych (ang. t test for dependent groups) stosuje się w sytuacji gdy pomiarów badanej zmiennej dokonujemy dwukrotnie w różnych warunkach (przy czym zakładamy, że wariancje zmiennej w obu pomiarach są sobie bliskie). Interesuje nas różnica pomiędzy parami pomiarów ($d_i=x_{1i}-x_{2i}$). Różnica ta wykorzystywana jest do weryfikacji hipotezy o tym, że średnia dla niej (dla różnicy) w badanej populacji wynosi 0.

Podstawowe warunki stosowania:

Hipotezy:

\begin{array}{cc}
\mathcal{H}_0: & \mu_0=0,\\
\mathcal{H}_1: & \mu_0\ne0,
\end{array}

gdzie:

$\mu_0$, $-$ średnia różnic $d_i$ w populacji.

Statystyka testowa ma postać: \begin{displaymath}
t=\frac{\overline{d}}{sd_d}\sqrt{n},
\end{displaymath}

gdzie:

$\overline{d}$ $-$ średnia różnic $d_i$ w próbie,

$sd_d $ $-$ odchylenie standardowe różnic $d_i$ w próbie,

$n$ $-$ liczność różnic $d_i$ w próbie.

Statystyka testowa ma rozkład t-Studenta z $n-1$ stopniami swobody.

Wyznaczoną na podstawie statystyki testowej wartość $p$ porównujemy z poziomem istotności $\alpha$:

\begin{array}{ccl}
$ jeżeli $ p \le \alpha & \Longrightarrow & $ odrzucamy $ \mathcal{H}_0 $ przyjmując $ 	\mathcal{H}_1, \\
$ jeżeli $ p > \alpha & \Longrightarrow & $ nie ma podstaw, aby odrzucić $ \mathcal{H}_0. \\
\end{array}

Uwaga!

  • odchylenie standardowe różnicy wyraża się wzorem:

\begin{displaymath}
sd_d=\displaystyle{\sqrt{\frac{\sum_{i=1}^{n}(d_i-\overline{d})^2}{n-1}}},
\end{displaymath}

  • błąd standardowy średniej różnic wyraża się wzorem:

\begin{displaymath}
SEM_{d}=\displaystyle{\frac{SD_d}{\sqrt{n}}}.
\end{displaymath}

Standaryzowana wielkość efektu.

Współczynnik d-Cohena określa jak dużą częścią występującej zmienności jest różnica między średnimi, biorąc pod uwagę skorelowanie zmiennych.

\begin{displaymath}
	d=\frac{dz}{\sqrt{1-r_p}},
\end{displaymath}.

Przy interpretacji efektu badacze często posługują się ogólnymi, określonymi przez Cohena 4) wskazówkami definiującymi małą (0.2), średnią (0.5) i dużą (0.8) wielkość efektu.

Okno z ustawieniami opcji testu t-Studenta dla grup zależnych wywołujemy poprzez menu StatystykaTesty parametrycznet-Student dla grup zależnych lub poprzez ''Kreator''.

Uwaga!

Obliczenia mogą bazować na danych w postaci surowych rekordów lub danych uśrednionych tzn. średniej różnic, odchyleniu standardowym różnic i liczności próby.

Przykład (plik BMI.pqs)

W klinice leczącej zaburzenia odżywiana badano wpływ zalecanej „diety A” na zmianę masy ciała. Próbę 120 otyłych chorych poddano diecie. Zbadano dla nich poziom BMI dwukrotnie: przed wprowadzeniem diety i po 180 dniach stosowania diety. By sprawdzić skuteczność diety porównano uzyskane wyniki pomiarów BMI.

Hipotezy:


$
\begin{array}{cl}
\mathcal{H}_0: & $średnie wartości BMI nie zmieniają się na skutek stosowania diety$\\
\mathcal{H}_1: & $średnie wartości BMI zmieniają się na skutek stosowania diety$
\end{array}
$

Porównując wartość $p<0.0001$ z poziomem istotności $\alpha=0.05$ stwierdzamy, że średni poziom BMI zmienił się istotnie. Przed stosowaniem diety był wyższy średnio o niecałe 2 jednostki.

W badaniu możliwe było stosowanie testu t-Studenta dla grup zależnych, ponieważ rozkład różnicy pomiędzy parami pomiarów był rozkładem normalnym (test Lillieforsa, wartość $p=0.0837$).

2014/08/22 20:00
1) , 4)
Cohen J. (1988), Statistical Power Analysis for the Behavioral Sciences, Lawrence Erlbaum Associates, Hillsdale, New Jersey
2)
Cochran W.G. and Cox G.M. (1957), Experimental designs (2nd 4.). New York: John Wiley and Sons.
3)
Satterthwaite F.E. (1946), An approximate distribution of estimates of variance components. Biometrics Bulletin, 2, 1 10-1 14
pl/statpqpl/porown2grpl/parpl.txt · ostatnio zmienione: 2014/08/22 21:17 (edycja zewnętrzna)

Narzędzia strony