Test Z dla dwóch niezależnych proporcji

Test $Z$ dla dwóch niezależnych proporcji stosujemy w podobnych sytuacjach jak test chi-kwadrat (2x2), tzn. gdy mamy 2 niezależne próby o liczności $n_1$ i $n_2$, w których możemy uzyskać 2 możliwe wyniki badanej cechy (jeden z nich to wynik wyróżniony o liczności $m_1$ - w pierwszej próbie i $m_2$ - w drugiej próbie). Dla prób tych możemy również wyznaczyć wyróżnione proporcje $p_1=\frac{m_1}{n_1}$ i $p_2=\frac{m_2}{n_2}$. Test ten służy do weryfikacji hipotezy, że wyróżnione proporcje $P_1$ i $P_2$ w populacjach, z których pochodzą próby są sobie równe.
Podstawowe warunki stosowania:

Hipotezy:


$
\begin{array}{cl}
\mathcal{H}_0: & P_1=P_2,\\
\mathcal{H}_1: & P_1\neq P_2,
\end{array}
$

gdzie:

$P_1$, $P_2$ frakcja dla pierwszej i drugiej populacji.

Statystyka testowa ma postać: \begin{displaymath}
Z=\frac{p_1-p_2}{\sqrt{p(1-p)\left(\frac{1}{n_1}+\frac{1}{n_2}\right)}},
\end{displaymath}

gdzie:

$p=\frac{m_1+m_2}{n_1+n_2}$.

Zmodyfikowana o poprawkę na ciągłość statystyka testowa ma postać:

\begin{displaymath}
Z=\frac{p_1-p_2-\frac{1}{2}\left(\frac{1}{n_1}+\frac{1}{n_2} \right)}{\sqrt{p(1-p)\left(\frac{1}{n_1}+\frac{1}{n_2}\right)}}.
\end{displaymath}

Statystyka bez korekcji na ciągłość jak i z tą korekcją ma asymptotycznie (dla dużych liczności) rozkład normalny.

Wyznaczoną na podstawie statystyki testowej wartość $p$ porównujemy z poziomem istotności $\alpha$:

\begin{array}{ccl}
$ jeżeli $ p \le \alpha & \Longrightarrow & $ odrzucamy $ \mathcal{H}_0 $ przyjmując $ 	\mathcal{H}_1, \\
$ jeżeli $ p > \alpha & \Longrightarrow & $ nie ma podstaw, aby odrzucić $ \mathcal{H}_0. \\
\end{array}

W programie oprócz różnicy proporcji wyliczana jest wartość wskaźnika NNT.

NNT (ang. number needed to treat) $-$ wskaźnik stosowany w medycynie, oznacza liczbę pacjentów, których trzeba poddać leczeniu przez określony czas, aby wyleczyć jedną osobę.

Uwaga!

Przedziały ufności dla różnicy dwóch niezależnych proporcji od wersji PQStat 1.3.0 estymowane są w oparciu o metodę Newcomba-Wilsona. W poprzednich wersjach były estymowane w oparciu o metodę Walda.

Uzasadnienie zmiany:

Przedziały ufności oparte o klasyczną metodę Walda są odpowiednie dla dużych rozmiarów próbek i różnicy proporcji dalekiej od 0 lub 1. Dla małych prób i różnicy proporcji bliskiej tym skrajnym wartościom, w wielu sytuacjach praktycznych, metoda Walda może prowadzić do wyników niewiarygodnych (Newcombe 19981), Miettinen 19852), Beal 19873), Wallenstein 19974)). Porównanie i przeanalizowanie wielu metod, które mogą być używane zamiast prostej metody Walda, można znaleźć w pracy Newcombe (1998)5). Sugerowaną, odpowiednią również dla skrajnych wartości proporcji, jest roszerzona na przedziały dla różnicy dwóch niezależnych proporcji, metoda opublikowana po raz pierwszy przez Wilsona (1927)6).

Uwaga!

Przedział ufności dla NNT wyliczany jest w oparciu o metodę Newcomba-Wilsona (Bender (2001)7), Newcombe (1998)8), Wilson (1927)9)).

Okno z ustawieniami opcji testu Z dla dwóch niezależnych proporcji wywołujemy poprzez menu StatystykaTesty nieparametryczneZ dla dwóch niezależnych proporcji.

Przykład c.d. (plik płeć-egzamin.pqs)

Wiemy, że $\frac{50}{90}=55.56\%$ z wszystkich kobiet w próbie zdaje pozytywnie egzamin i $\frac{20}{80}=25.00\%$ z wszystkich mężczyzn w próbie zdaje egzamin pozytywnie. Dane możemy zapisać na dwa sposoby $-$ jako licznik i mianownik dla każdej próby, lub jako proporcja i mianownik dla każdej próby:

Hipotezy:


$
\begin{array}{cl}
\mathcal{H}_0: & $proporcja mężczyzn, uzyskujących pozytywny wynik egzaminu jest taka$\\
&$ sama jak kobiet uzyskujących pozytywny wynik egzaminu w badanej populacji,$\\
\mathcal{H}_1: & $proporcja mężczyzn, uzyskujących pozytywny wynik egzaminu jest inna niż$\\
&$ proporcja kobiet uzyskujących pozytywny wynik egzaminu w badanej populacji.$
\end{array}
$

Uwaga!

Ponieważ w arkuszu danych znajduje się więcej informacji, przed rozpoczęciem analizy należy zaznaczyć odpowiedni obszar (dane bez nagłówków). W oknie testu natomiast wybrać opcję mówiącą o zawartości zmiennej (liczność (licznik) lub proporcja). Różnica proporcji wyróżnionych w próbie to 30.56%, a 95% przedział ufności dla niej (15.90%, 43.35%) nie zawiera 0.

Na podstawie testu $Z$ bez poprawki na ciągłość ($p$=0.000053) jak też z poprawką na ciągłość ($p$=0.0001), na poziomie istotności $\alpha$=0.05 (podobnie jak w przypadku testu dokładnego Fishera, jego poprawki mid-p, testu $\chi^2$ i testu $\chi^2$ z poprawką Yatesa) przyjmujemy hipotezę alternatywną. Zatem proporcja mężczyzn, uzyskujących pozytywny wynik egzaminu jest inna niż proporcja kobiet uzyskujących pozytywny wynik egzaminu w badanej populacji. Istotnie częściej ten egzamin zdają kobiety ($\frac{50}{90}=55.56\%$ z wszystkich kobiet w próbie zdało egzamin) niż mężczyźni ($\frac{20}{80}=25.00\%$ z wszystkich mężczyzn w próbie zdało egzamin).

Przykład

Załóżmy, że choroba ma śmiertelność 100% bez leczenia, a terapia zmniejsza śmiertelność do 50% - jest to wynik 20 letnich badań. Chcemy wiedzieć jak wiele osób będzie trzeba leczyć, aby zapobiec w ciągu 20 lat 1 śmierci. By odpowiedzieć na to pytanie pobrano dwie 100 osobowe próby z populacji osób chorych. W próbie nieleczonych mamy 100 chorych pacjentów, wiemy, że bez leczenia wszyscy oni umrą. W próbie leczonych mamy również 100 pacjentów, z których 50 przeżyje.

\begin{tabular}{|c|c||c|c|}\hline
\multicolumn{2}{|c||}{Chorzy $-$ nie leczeni }& \multicolumn{2}{|c|}{Chorzy $-$ leczeni}\\\hline
liczność licznik&liczność próby (mianownik)&liczność licznik&liczność próby (mianownik)\\\hline
100&100&50&100\\\hline
\end{tabular}

Wyliczymy wskaźnik NNT.

Różnica pomiędzy proporcjami jest istotna statystycznie ($p<0.000001$), ale nas interesuje wskaźnik NNT - wynosi on 2, czyli stosowanie leczenia u 2 chorych przez 20 lat zapobiegnie 1 śmierci. Wyliczony 95% przedział ufności należy zaokrąglić do wartości całkowitych, co daje NNT od 2 do 3 chorych.

1) , 5) , 8)
Newcombe R.G. (1998), Interval Estimation for the Difference Between Independent Proportions: Comparison of Eleven Methods. Statistics in Medicine 17: 873-890
2)
Miettinen O.S. and Nurminen M. (1985), Comparative analysis of two rates. Statistics in Medicine 4: 213-226
3)
Beal S.L. (1987), Asymptotic confidence intervals for the difference between two binomial parameters for use with small samples. Biometrics 43: 941-950
4)
Wallenstein S. (1997), A non-iterative accurate asymptotic confidence interval for the difference between two Proportions. Statistics in Medicine 16: 1329-1336
6) , 9)
Wilson E.B. (1927), Probable Inference, the Law of Succession, and Statistical Inference. Journal of the American Statistical Association: 22(158):209-212
7)
Bender R. (2001), Calculating confidence intervals for the number needed to treat. Controlled Clinical Trials 22:102–110

Narzędzia witryny