Test chi-kwadrat oraz test Fishera dla małych tabel

Testy te opierają się na danych zebranych w postaci tabeli kontyngencji 2 cech ($X$, $Y$), z których każda ma możliwe 2 kategorie $X_1, X_2$ oraz $Y_1, Y_2$.

Podstawowe warunki stosowania:

Dodatkowy warunek dla testu $\chi^2$:


$
\begin{array}{cl}
\mathcal{H}_0: & O_{ij}=E_{ij} $ dla wszystkich kategorii,$\\
\mathcal{H}_1: & O_{ij} \neq E_{ij} $ dla przynajmniej jednej kategorii,$
\end{array}
$

gdzie:

$O_{ij}$ - liczności obserwowane w tabeli kontyngencji,

$E_{ij}$ - liczności oczekiwane w tabeli kontyngencji.

  • Hipotezy w brzmieniu testu niezależności:


$
\begin{array}{cl}
\mathcal{H}_0: & $nie istnieje zależność pomiędzy badanymi cechami populacji$\\
& $(obie klasyfikacje ze względu na cechę $X$ i $Y$ są statystycznie niezależne),$\\
\mathcal{H}_1: & $istnieje zależność pomiędzy badanymi cechami populacji.$
\end{array}
$

  • Hipotezy w brzmieniu testu homogeniczności:


$
\begin{array}{cl}
\mathcal{H}_0: & $w badanej populacji rozkład kategorii cechy $X$ jest taki sam$\\
&$ dla obu kategorii cechy $Y$,$\\
\mathcal{H}_1: & $w badanej populacji rozkład kategorii cechy $X$ jest inny $\\
&$ dla obu kategorii cechy $Y$.$
\end{array}
$

Wyznaczoną wartość $p$ porównujemy z poziomem istotności $\alpha$:

\begin{array}{ccl}
$ jeżeli $ p \le \alpha & \Longrightarrow & $ odrzucamy $ \mathcal{H}_0 $ przyjmując $ 	\mathcal{H}_1, \\
$ jeżeli $ p > \alpha & \Longrightarrow & $ nie ma podstaw, aby odrzucić $ \mathcal{H}_0. \\
\end{array}

Uwaga!

Dodatkowo dla tabel kontyngencji $2\times 2$ program $\mathbb{PQ}$Stat wyznacza iloraz szans (ang. odds ratio - OR) jak też relatywne ryzyko (ang. relative risk - RR) wraz z przedziałami ufności. Przedziały te wyznaczane są na podstawie aproksymowanego rozkładu $\chi^2$ - gdy towarzyszą testowi $\chi^2$ lub dokładnych algorytmów - gdy towarzyszą testowi Fishera i mid-p.

Okno z ustawieniami opcji testu Chi-kwadrat oraz jego poprawek wywołujemy poprzez menu StatystykaTesty nieparametryczneChi-kwadrat, Fisher, OR/RR lub poprzez ''Kreator''.

Test chi-kwadrat dla tabel 2×2

Test $\chi^2$ dla tabel $2\times 2$ (ang. Pearson's Chi-square test), Karl Pearson 1900. Test ten jest zawężeniem testu chi-kwadrat dla tabel (r x c).

Statystyka testowa ma postać:

\begin{displaymath}
\chi^2=\sum_{i=1}^2\sum_{j=1}^2\frac{(O_{ij}-E_{ij})^2}{E_{ij}}.
\end{displaymath}

Statystyka ta ma asymptotycznie (dla dużych liczności oczekiwanych) rozkład chi-kwadrat z jednym stopniem swobody.

Test chi-kwadrat z poprawką Yatesa na ciągłość

Test $\chi^2$ z poprawką Yatesa (ang. Chi-square test with Yates correction), Frank Yates (1934)2) jest testem bardziej konserwatywny od testu chi-kwadrat (trudniej niż test chi-kwadrat odrzuca hipotezę zerową). Poprawka na ciągłość ma zapewnić możliwość przyjmowania przez statystykę testową wszystkich wartości liczb rzeczywistych zgodnie z założeniem rozkładu chi-kwadrat.

Statystyka testowa ma postać:

\begin{displaymath}
\chi^2=\sum_{i=1}^2\sum_{j=1}^2\frac{(|O_{ij}-E_{ij}|-0.5)^2}{E_{ij}}.
\end{displaymath}

Test Fishera dla tabel 2×2

Test Fishera dla tabel $2\times 2$ nazywany jest również testem dokładnym Fishera (ang. Fisher exact test), R. A. Fisher (19343), 19354)). Test ten określa dokładne prawdopodobieństwo wystąpienia konkretnego rozkładu liczb w tabeli przy znanym $n$ i ustalonych sumach brzegowych. \begin{displaymath}
P=\frac{{O_{11}+O_{21} \choose O_{11}}{O_{12}+O_{22} \choose O_{12}}}{{O_{11}+O_{12}+O_{21}+O_{22} \choose O_{11}+O_{12}}}.
\end{displaymath} Przy znanych sumach brzegowych, dla różnych układów wartości obserwowanych wyznaczamy prawdopodobieństwa $P$. Dokładny poziom istotności $p$ jest sumą tych prawdopodobieństw, które są mniejsze lub równe badanemu prawdopodobieństwu.

Test mid-p

mid-p jest korektą testu dokładnego Fishera. Ta zmodyfikowana wartość $p$ jest rekomendowana przez wielu statystyków (Lancaster 19615), Anscombe 19816), Pratt i Gibbons 19817), Plackett 19848), Miettinen 19859) i Barnard 198910), Rothman 200811)) jako metoda zmniejszenia konserwatyzm testu dokładnego Fishera. W rezultacie testem mid-p szybciej odrzucimy hipotezę zerowa niż dokładnym testem Fishera. Dla dużych prób wartość $p$ otrzymana przy pomocy testu $\chi^2$ z poprawką Yatesa i test Fishera dają zbliżone wyniki, natomiast wartość $p$ testu $\chi^2$ bez korekcji koresponduje z wartością mid-p.

Wartość $p$ mid-p wyznaczana jest przez przekształcenie wartości prawdopodobieństwa dla testu dokładnego Fishera. Jednostronna wartość $p$ wyznaczana jest ze wzoru:

\begin{displaymath}
p_{I(mid-p)}=p_{I(Fisher)}-0.5\cdot P_{punktu(tabeli\quad zadanej)},
\end{displaymath}

gdzie:

$p_{I(mid-p)}$ $-$ wartość jednostronna $p$ testu mid-p

$p_{I(Fisher)}$ $-$ wartość jednostronna $p$ testu dokładnego Fishera

a dwustronna wartość $p$ jest definiowana jako podwojona wartość mniejszego z jednostronnych prawdopodobieństw:

\begin{displaymath}
p_{II(mid-p)}=2p_{I(mid-p)},
\end{displaymath}

gdzie:

$p_{II(mid-p)}$ $-$ wartość dwustronna $p$ testu mid-p.

Przykład (plik płeć-egzamin.pqs)

Rozpatrzmy próbę składającą się z 170 osób ($n=170$), dla których badamy 2 cechy ($X$=płeć, $Y$=zdawalność egzaminu). Każda z tych cech występuje w dwóch kategoriach ($X_1$=k, $X_2$=m, $Y_1$=tak, $Y_2$=nie). Na podstawie tej próby chcielibyśmy się dowiedzieć, czy w badanej populacji istnieje zależność pomiędzy płcią a zdawalnością egzaminu. Rozkład danych przedstawia tabeli kontyngencji:

\begin{tabular}{|c|c||c|c|c|}
\hline
\multicolumn{2}{|c||}{Liczności obserwowane }& \multicolumn{3}{|c|}{zdawalność egzaminu}\\\cline{3-5}
\multicolumn{2}{|c||}{$O_{ij}$} & tak & nie & suma \\\hline \hline
\multirow{3}{*}{płeć}& k & 50 & 40 & 90 \\\cline{2-5}
& m & 20 & 60 & 80 \\\cline{2-5}
& suma & 70 & 100 & 170\\\hline
\end{tabular}

Hipotezy:


$
\begin{array}{cl}
\mathcal{H}_0: & $nie istnieje zależność pomiędzy płcią a zdawalnością egzaminu w badanej populacji,$\\
\mathcal{H}_1: & $istnieje zależność pomiędzy płcią a zdawalnością egzaminu w badanej populacji.$
\end{array}
$

Tabela liczności oczekiwanych nie zawiera wartości mniejszych niż 5. Warunek Cochrana jest spełniony.

Przy przyjętym poziomie istotności $\alpha=0.05$ wszystkie wykonane testy potwierdziły prawdziwość hipotezy alternatywnej:

  • test chi-kwadrat, wartość $p=0.000053$,
  • test chi-kwadrat z poprawką Yeatesa, wartość $p=0.000103$,
  • test dokładny Fishera, wartość $p=0.000083$,
  • test mid-p, wartość $p=0.000054$

Zatem istnieje zależność pomiędzy płcią a zdawalnością egzaminu w badanej populacji. Istotnie częściej ten egzamin zdają kobiety ($\frac{50}{90}=55.56\%$ z wszystkich kobiet w próbie zdało egzamin) niż mężczyźni ($\frac{20}{80}=25.00\%$ z wszystkich mężczyzn w próbie zdało egzamin)

1)
Cochran W.G. (1952), The chi-square goodness-of-fit test. Annals of Mathematical Statistics, 23, 315-345
2)
Yates F. (1934), Contingency tables involving small numbers and the chi-square test. Journal of the Royal Statistical Society, 1,2 17-235
3)
Fisher R.A. (1934), Statistical methods for research workers (5th ed.). Edinburgh: Oliver and Boyd.
4)
Fisher R.A. (1935), The logic of inductive inference. Journal of the Royal Statistical Society, Series A, 98,39-54
5)
Lancaster H.O. (1961), Significance tests in discrete distributions. Journal of the American Statistical Association 56:223-234
6)
Anscombe F.J. (1981), Computing in Statistical Science through APL. Springer-Verlag, New York
7)
Pratt J.W. and Gibbons J.D. (1981), Concepts of Nonparametric Theory. Springer-Verlag, New York
8)
Plackett R.L. (1984), Discussion of Yates' „Tests of significance for 2×2 contingency tables”. Journal of Royal Statistical Society Series A 147:426-463
9)
Miettinen O.S. (1985), Theoretical Epidemiology: Principles of Occurrence Research in Medicine. John Wiley and Sons, New York
10)
Barnard G.A. (1989), On alleged gains in power from lower p-values. Statistics in Medicine 8:1469-1477
11)
Rothman K.J., Greenland S., Lash T.L. (2008), Modern Epidemiology, 3rd ed. (Lippincott Williams and Wilkins) 221-225

Narzędzia witryny