Współczynniki kontyngencji są wyliczane dla danych w postaci surowej lub danych zebranych w tabelę kontyngencji.
Okno z ustawieniami opcji miar zależności dla tabel wywołujemy poprzez menu Statystyka
→Testy nieparametryczne
→Chi-kwadrat, Fisher, OR/RR
→Współczynniki korelacji…
lub poprzez ''Kreator''.
Współczynnik kontyngencji Q-Yulea
Współczynnik kontyngencji -Yulea (Yule's Q contingency coefficient), Yule (1900)1), jest miarą zależności, która może być wyznaczana dla tabel kontyngencji
gdzie:
- liczności obserwowane w tabeli kontyngencji.
Oryginalnie wartość współczynnika mieści się w przedziale . Im wartość ta jest bliższa 0, tym siła związku pomiędzy badanymi cechami jest mniejsza, a im bliższa 1 lub +1, tym siła badanego związku jest większa (ze względu na błędy w interpretacji ujemnej wartości współczynnika, wyniki tego współczynnika w programie PQStat przedstawiane są wówczas również jako wartość bezwzględna). Wadą tego współczynnika jest to, iż jest mało odporny na małe liczności obserwowane (gdy jakaś z liczności obserwowanych wynosi 0, to współczynnik może błędnie wskazywać całkowitą zależność cech).
Istotność statystyczną wyznaczonego współczynnika kontyngencji -Yulea określamy testem .
Hipotezy:
Statystyka testowa ma postać:
Statystyka testowa ma asymptotycznie (dla dużych liczności ) rozkład normalny.
Wyznaczoną na podstawie statystyki testowej wartość porównujemy z poziomem istotności :
Współczynnik kontyngencji (ang. phi contingency coefficient) jest miarą zależności polecaną szczególnie dla tabel kontyngencji , chociaż możliwą do wyznaczenia dla dowolnych tabel.
Wartość współczynnika mieści się w przedziale . Im wartość ta jest bliższa 0, tym siła związku pomiędzy badanymi cechami jest mniejsza, a im bliższa wartości 1 tym większa.
Współczynnik kontyngencji uznaje się za istotny statystycznie jeśli wartość wyznaczona na podstawie statystyki testu chi-kwadrat i rozkładu chi-kwadrat (wyznaczonego dla tej tabeli) jest równa bądź mniejsza niż poziom istotności .
Współczynnik kontyngencji -Cramera
Współczynnik kontyngencji -Cramera (ang. Cramer's V contingency coefficient), Cramer (1946)2), jest rozszerzeniem współczynnika na tabele kontyngencji .
gdzie:
wartość - wartość statystyki testu chi-kwadrat,
- całkowita liczność w tabeli kontyngencji,
- jest mniejszą z dwóch wartości i .
Wartość współczynnika mieści się w przedziale . Im wartość ta jest bliższa 0, tym siła związku pomiędzy badanymi cechami jest mniejsza, a im bliższa +1, tym siła badanego związku jest większa. Wartość współczynnika zależy również od wielkości tabeli, stąd nie powinno się stosować tego współczynnika do porównywania tabel kontyngencji o różnych wielkościach.
Współczynnik kontyngencji uznaje się za istotny statystycznie jeśli wartość wyznaczona na podstawie statystyki testu chi-kwadrat i rozkładu chi-kwadrat (wyznaczonego dla tej tabeli) jest równa bądź mniejsza niż poziom istotności .
Współczynnik kontyngencji -Cohena
Współczynnik kontyngencji -Cohena (ang. Cohen's w contingency coefficient), Cohen (1988)3), jest modyfikacją współczynnika -Cramera i jest możliwy do wyliczenia dla tabel .
gdzie:
wartość - wartość statystyki testu chi-kwadrat,
- całkowita liczność w tabeli kontyngencji,
- jest mniejszą z dwóch wartości i .
Wartość współczynnika mieści się w przedziale , gdzie (dla tabel, w których co najmniej jedna zmienna zawiera tylko dwie kategorie wartość współczynnika mieści się w przedziale ). Im wartość ta jest bliższa 0, tym siła związku pomiędzy badanymi cechami jest mniejsza, a im bliższa maksymalnej wartości, tym siła badanego związku jest większa. Wartość współczynnika zależy od wielkości tabeli, stąd nie powinno się stosować tego współczynnika do porównywania tabel kontyngencji o różnych wielkościach.
Współczynnik kontyngencji uznaje się za istotny statystycznie jeśli wartość wyznaczona na podstawie statystyki testu chi-kwadrat i rozkładu chi-kwadrat (wyznaczonego dla tej tabeli) jest równa bądź mniejsza niż poziom istotności .
Współczynnik kontyngencji C Pearsona
Współczynnik kontyngencji -Pearsona (ang. Pearson's C contingency coefficient) jest miarą zależności wyznaczaną dla tabel kontyngencji
Wartość współczynnika mieści się w przedziale . Im wartość ta jest bliższa 0, tym siła związku pomiędzy badanymi cechami jest mniejsza, a im dalsza od 0, tym siła badanego związku jest większa. Ponieważ wartość współczynnika zależy również od wielkości tabeli (im większa tabela, tym wartość może być bliższa 1), dlatego wyznacza się górną granicę jaką dla danej wielkości tabeli współczynnik może osiągnąć:
gdzie:
- jest mniejszą z dwóch wartości i .
Niewygodną konsekwencją uzależnienia wartości od wielkości tabeli jest brak możliwości porównywania wartości współczynnika wyznaczonego dla różnych wielkości tabel kontyngencji. Nieco lepszą miarą w takim przypadku jest dostosowana do wielkości tabeli wielkość współczynnika kontyngencji
Współczynnik kontyngencji uznaje się za istotny statystycznie jeśli wartość wyznaczona na podstawie statystyki testu chi-kwadrat i rozkładu chi-kwadrat (wyznaczonego dla tej tabeli) jest równa bądź mniejsza niż poziom istotności .
Przykład (plik płeć-egzamin.pqs)
Rozpatrzmy próbę składającą się z 170 osób (), dla których badamy 2 cechy (=płeć, =zdawalność egzaminu). Każda z tych cech występuje w dwóch kategoriach (=k, =m, =tak, =nie). Na podstawie tej próby chcielibyśmy się dowiedzieć, czy w badanej populacji istnieje zależność pomiędzy płcią a zdawalnością egzaminu. Rozkład danych przedstawia tabeli kontyngencji:}
Wartość statystyki testowej wynosi a wyznaczona dla niej wartość . Uzyskany wynik wskazuje na istnienie zależności statystycznej pomiędzy płcią a zdawalnością egzaminu w badanej populacji.
Wartość współczynników opartych o test , a zatem siła związku między badanymi cechami to:
Współczynnik kontyngencji -Pearsona = 0.42.
Współczynnik kontyngencji -Cramera = = -Cohena =0.31
Współczynnik kontyngencji -Yulea=0.58, a wartość wykonanego testu podobnie jak poziom istotności testu wskazuje na istotność statystyczną badanego związku.