Test chi-kwadrat zgodności

Test $\chi^2$ zgodności (dobroci dopasowania) (ang. Chi-square goodnes-of-fit test) nazywany jest również testem $\chi^2$ dla pojedynczej próby, przeznaczony jest do testowania zgodności wartości obserwowanych dla $r$ ($r>=2$) kategorii $X_1, X_2,..., X_r$ jednej cechy $X$ z hipotetycznymi wartościami oczekiwanymi dla tej cechy. Wartości wszystkich $n$ pomiarów należy zebrać w postaci tabeli składającej się z $r$ wierszy (kategorii: $X_1, X_2, ..., X_r$). Dla każdej kategorii $X_i$ zapisuje się częstość jej występowania $O_i$, oraz częstość dla niej oczekiwaną $E_i$ lub prawdopodobieństwo jej wystąpienia $p_i$. Częstość oczekiwana jest wyznaczana jako iloczyn $E_i=np_i$.
Utworzona tabela może przyjąć jedną z poniższych postaci:

\begin{tabular}[t]{c@{\hspace{1cm}}c}
\begin{tabular}{c|c c}
Kategorie $X_i$ & $O_i$ & $E_i$ \\\hline
$X_1$ & $O_1$ & $E_i$ \\
$X_2$ & $O_2$ & $E_2$ \\
... & ... & ...\\
$X_r$ & $O_r$ & $E_r$ \\
\end{tabular}
&
\begin{tabular}{c|c c}
Kategorie $X_i$ &  $O_i$ & $p_i$ \\\hline
$X_1$ & $O_1$ & $p_1$ \\
$X_2$ & $O_2$ & $p_2$ \\
... & ... & ...\\
$X_r$ & $O_r$ & $p_r$ \\
\end{tabular}
\end{tabular}

Podstawowe warunki stosowania:

  • pomiar na skali nominalnej - ewentualne uporządkowanie kategorii nie jest brane pod uwagę,
  • suma liczności obserwowanych powinna być taka sama jak suma liczności oczekiwanych, a suma wszystkich prawdopodobieństw $p_i$ powinna wynosić 1.

Hipotezy:

$\mathcal{H}_0 : O_i=E_i$ dla wszystkich kategorii,
$\mathcal{H}_1 : O_i \neq E_i$ dla przynajmniej jednej kategorii.

Statystyka testowa ma postać: \begin{displaymath}
\chi^2=\sum_{i=1}^r\frac{(O_i-E_i)^2}{E_i}.
\end{displaymath} Statystyka ta ma asymptotycznie (dla dużych liczności oczekiwanych) rozkład chi-kwadrat z liczbą stopni swobody wyznaczaną według wzoru: $df=(r-1)$.
Wyznaczoną na podstawie wartości statystyki i rozkładu $\chi^2$ wartość $p$ porównujemy z poziomem istotności $\alpha$:


$ \begin{array}{ccl}
$ jeżeli $ p \le \alpha & \Longrightarrow & $ odrzucamy $ \mathcal{H}_0 $ przyjmując $ 	\mathcal{H}_1, \\
$ jeżeli $ p > \alpha & \Longrightarrow & $ nie ma podstaw, aby odrzucić $ \mathcal{H}_0. 
\end{array}$

Okno z ustawieniami opcji testu Chi-kwadrat zgodności wywołujemy poprzez menu StatystykaTesty nieparametryczneChi-kwadrat lub poprzez ''Kreator''.

Przykład (plik obiady.pqs)

Chcielibyśmy się dowiedzieć, czy liczba wydawanych obiadów w kolejnych dniach tygodnia (od poniedziałku do piątku) w pewnej szkolnej stołówce jest statystycznie taka sama. W tym celu pobrano tygodniową próbę i zapisano dla niej liczbę wydanych obiadów w poszczególnych dniach: poniedziałek - 33, wtorek - 29, środa - 32, czwartek - 36, piątek - 20.}

Łącznie przez cały tydzień (5 dni) wydano 150 obiadów. Zakładamy, że w każdy dzień prawdopodobieństwo wydania obiadu jest takie samo, czyli wynosi $\frac{1}{5}$. Oczekiwana liczba wydanych obiadów dla każdego z pięciu dni tygodnia wynosi więc $E_i=150\cdot\frac{1}{5}=30$.

Postawiono hipotezy:


$
\begin{array}{cl}
\mathcal{H}_0: & $liczba wydawanych obiadów w badanej stołówce szkolnej w kolejnych dniach tygodnia $\\
& $jest zgodna z oczekiwaną liczbą wydawanych obiadów w tych dniach$\\
\mathcal{H}_1: & $liczba wydawanych obiadów w badanej stołówce szkolnej w kolejnych dniach tygodnia$\\
& $nie jest zgodna z oczekiwaną liczbą wydawanych obiadów w tych dniach$
\end{array}
$

Wartość $p$ z rozkładu $\chi^2$ dla 4 stopni swobody wynosi 0.287297. Zatem na poziomie istotności $\alpha=0.05$ możemy powiedzieć, że nie mamy podstaw, aby odrzucić hipotezę zerową mówiącą o zgodności liczby wydawanych obiadów z oczekiwaną liczbą wydawanych obiadów w poszczególnych dniach.

Uwaga!

Gdybyśmy chcieli w ramach jednego badania dokonać większej liczby porównań, moglibyśmy zastosować poprawkę Bonferroniego 2) lub inną z poprawek opisanych w dziale Wielokrotne porównania. Ta poprawka jest używana by ograniczyć wielkość popełnionego błędu pierwszego rodzaju, gdy porównujemy wartości obserwowane i oczekiwane pomiędzy wybranymi dniami np:

Pt $\Longleftrightarrow$ Pn,

Pt $\Longleftrightarrow$ Wt,

Pt $\Longleftrightarrow$ Śr,

Pt $\Longleftrightarrow$ Czw,

przy założeniu, że porównania wykonujemy niezależnie. Poziom istotności $\alpha$ dla każdego porównania wyznaczamy zgodnie z tą poprawką według wzoru: $\alpha=\frac{0.05}{r}$, gdzie $r$ to liczba wykonywanych porównań. Poziom istotności dla pojedynczego porównania zgodnie z poprawką Bonferroniego wynosi dla naszego przykładu $\alpha=\frac{0.05}{4}=0.0125$.

Należy jednak pamiętać, że redukując $\alpha$ dla każdego porównania zmniejszamy również moc testu.

1)
Cochran W.G. (1952), The chi-square goodness-of-fit test. Annals of Mathematical Statistics, 23, 315-345
2)
Abdi H. (2007), Bonferroni and Sidak corrections for multiple comparisons, in N.J. Salkind (ed.): Encyclopedia of Measurement and Statistics. Thousand Oaks, CA: Sage

Narzędzia witryny