Spis treści

Analiza dla warstw

Metoda Mantela-Haenszela dla wielu tabel

Metoda Mantela-Haenszela dla tabel $2\times2$ (ang. Mantel-Haenszel method for 2×2 tables) zaproponowana została przez Mantela i Haenszela (1959)1) a następnie rozszerzona przez Mantela (1963)2). Szerszy przegląd rozwoju tych metod został przeprowadzony m.in. przez Newman (2001)3).

Metoda Mantela-Haenszela może być używana między innymi do analizy tabel $2\times2$ występujących w kilku ($w>=2$) warstwach tworzonych przez tzw. zmienną uwikłaną (ang. confounding). Dla kolejnych warstw ($s=1,...,w$) budowane są tabele kontyngencji $2\times2$ liczności obserwowanych:

\begin{tabular}{|c|c||c|c|c|}
\hline
\multicolumn{2}{|c||}{Liczności obserwowane }& \multicolumn{3}{|c|}{badane zjawisko}\\\cline{3-5}
\multicolumn{2}{|c||}{$s$-tej warstwy $\left(O_{ij}^{(s)}\right)$} & występuje & nie występuje & Suma \\\hline \hline
\multirow{3}{*}{czynnik ryzyka}& występuje & $O_{11}^{(s)}$ & $O_{12}^{(s)}$ & $O_{11}^{(s)}+O_{12}^{(s)}$  \\\cline{2-5}
& nie występuje & $O_{21}^{(s)}$ & $O_{22}^{(s)}$ & $O_{21}^{(s)}+O_{22}^{(s)}$  \\\cline{2-5}
& Suma & $O_{11}^{(s)}+O_{21}^{(s)}$ & $O_{12}^{(s)}+O_{22}^{(s)}$ & $n^{(s)}=O_{11}^{(s)}+O_{12}^{(s)}+O_{21}^{(s)}+O_{22}^{(s)}$\\\hline
\end{tabular}

Okno z ustawieniami opcji metod Mantel-Haenszel OR/RR wywołujemy poprzez menu StatystykaAnaliza dla warstwMantel-Haenszel OR/RR.

Iloraz szans Mantela-Haenszela

Jeśli wszystkie tabele (tworzone przez poszczególne warstwy) są homogeniczne (warunek ten można sprawdzić przy pomocy testu chi-kwadrat homogeniczności OR), wówczas na podstawie tych tabel można wyznaczyć wspólny iloraz szans wraz z przedziałami ufności. Taki iloraz szans jest średnią ważoną ilorazów szans wyznaczonych dla poszczególnych warstw. Zastosowanie ważonej metody zaproponowanej przez Mantela i Haenszela pozwala na uwzględnienie wkładu (wagi), jaki do budowy wspólnego ilorazu szans wnosi każda warstwa (im bardziej liczna warstwa, tym większy ma wpływ na powstały iloraz szans).

Wagi dla każdej warstwy wyznacza się zgodnie z wzorem:

\begin{displaymath}
g^{(s)}=\frac{O_{21}^{(s)}\cdot O_{12}^{(s)}}{n^{(s)}},
\end{displaymath}

a Iloraz szans Mantela-Haenszela:

\begin{displaymath}
OR_{MH}=\frac{R}{S},
\end{displaymath}

gdzie:

$\displaystyle R=\sum_{s=1}^w\frac{O_{11}^{(s)}\cdot O_{22}^{(s)}}{n^{(s)}}$,

$\displaystyle S=\sum_{s=1}^wg^{(s)}$.

Przedział ufności dla $log OR_{MH}$ wyznacza się na podstawie błędu standardowego (RGB $-$ Robins$-$Breslow–-Greenland4)5)) wyliczonego ze wzoru:

\begin{displaymath}
SE_{MH}=\sqrt{\frac{T}{2R^2}+\frac{U+Y}{2RS}+\frac{W}{2S^2}},
\end{displaymath}

gdzie:

$\displaystyle T=\sum_{s=1}^wT^{(s)}$,\qquad
$\displaystyle T^{(s)}=\frac{O_{11}^{(s)}\cdot O_{22}^{(s)}\cdot \left(O_{11}^{(s)}+O_{22}^{(s)}\right)}{\left(n^{(s)}\right)^2}$,

$\displaystyle U=\sum_{s=1}^wU^{(s)}$,\qquad
$\displaystyle U^{(s)}=\frac{O_{21}^{(s)}\cdot O_{12}^{(s)}\cdot \left(O_{11}^{(s)}+O_{22}^{(s)}\right)}{\left(n^{(s)}\right)^2}$,

$\displaystyle Y=\sum_{s=1}^wY^{(s)}$,\qquad
$\displaystyle Y^{(s)}=\frac{O_{11}^{(s)}\cdot O_{22}^{(s)}\cdot \left(O_{21}^{(s)}+O_{12}^{(s)}\right)}{\left(n^{(s)}\right)^2}$,

$\displaystyle W=\sum_{s=1}^wW^{(s)}$,\qquad
$\displaystyle W^{(s)}=\frac{O_{21}^{(s)}\cdot O_{12}^{(s)}\cdot \left(O_{21}^{(s)}+O_{12}^{(s)}\right)}{\left(n^{(s)}\right)^2}$.

  • Test chi-kwadrat Mantela-Haenszela dla $OR_{MH}$

Test $\chi^2$ Mantela-Haenszela (ang. Mantel-Haenszel Chi-square test) służy do weryfikacji hipotezy o istotności wyznaczonego ilorazu szans ($OR_{MH}$) i powinien być wyliczany przy dużych licznościach, tzn. gdy są spełnione obydwa warunki tzw. „reguły 5”:

  • $\min(O_{11}^{(s)}+O_{12}^{(s)},O_{11}^{(s)}+O_{21}^{(s)})-\sum_{s=1}^wE_{11}^{(s)}\ge5$ dla wszystkich warstw $s=1,2,...,w$,
  • $\max(0,O_{11}^{(s)}-O_{22}^{(s)})\ge5$ dla wszystkich warstw $s=1,2,...,w$.

Kiedy występują wartości zerowe w tabeli stosowana jest korekta na ciągłość (powiększenie liczności o wartość o,5), zarówno dla liczności obserwowanych jak i dla liczności oczekiwanych.

Hipotezy:

\begin{array}{cl}
\mathcal{H}_0: & OR_{MH} = 1, \\
\mathcal{H}_1: & OR_{MH} \ne 1.
\end{array}

Statystyka testowa ma postać:

\begin{displaymath}
\chi^2_{MH}=\frac{\left(\sum_{s=1}^wO_{11}^{(s)}-\sum_{s=1}^wE_{11}^{(s)}\right)^2}{V},
\end{displaymath}

gdzie:

$\displaystyle E_{11}^{(s)}=\frac{\left(O_{11}^{(s)}+O_{21}^{(s)}\right)\left(O_{11}^{(s)}+O_{12}^{(s)}\right)}{n^{(s)}}$ to wartości oczekiwane w pierwszej komórce tabeli kontyngencji, dla poszczególnych warstw $s=1,2,...,w$,

$\displaystyle V=\sum_{s=1}^wV^{(s)}$,

$\displaystyle V^{(s)}=\frac{\left(O_{11}^{(s)}+O_{12}^{(s)}\right)\left(O_{21}^{(s)}+O_{22}^{(s)}\right)\left(O_{11}^{(s)}+O_{21}^{(s)}\right)\left(O_{12}^{(s)}+O_{22}^{(s)}\right)}{\left(n^{(s)}\right)^2\left(n^{(s)}-1\right)}$.

Statystyka ta ma asymptotycznie (dla dużych liczności) rozkład chi-kwadrat z jednym stopniem swobody.

Wyznaczoną na podstawie statystyki testowej wartość $p$ porównujemy z poziomem istotności $\alpha$:

\begin{array}{ccl}
$ jeżeli $ p \le \alpha & \Longrightarrow & $ odrzucamy $ \mathcal{H}_0 $ przyjmując $ 	\mathcal{H}_1, \\
$ jeżeli $ p > \alpha & \Longrightarrow & $ nie ma podstaw, aby odrzucić $ \mathcal{H}_0. \\
\end{array}

  • Test chi-kwadrat homogeniczności dla $OR$

Test $\chi^2$ homogeniczności dla $OR$ (ang. Chi-square test of homogeneity for $OR$) służy do weryfikacji hipotezy o tym, że zmienna tworząca warstwy jest efektem modyfikującym, tzn. wpływa ona na wyznaczany iloraz szans w taki sposób, że jest on znacząco inny dla poszczególnych warstw.

Hipotezy:

\begin{array}{cl}
\mathcal{H}_0: & OR_{MH} = OR^{(s)}, $ dla wszystkich warstw $s=1,2,...,w$,$ \\
\mathcal{H}_1: & OR_{MH} \ne OR^{(s)}, $ dla przynajmniej jednej warstwy.$
\end{array}

Statystyka testowa (Breslow–-Day (1980)6), Tarone (1985)7)8)) ma postać:

\begin{displaymath}
\chi^2=\sum_{s=1}^w\frac{\left(O_{11}^{(s)}-E^{(s)}\right)^2}{Var^{(s)}}-\frac{\left(\sum_{s=1}^wO_{11}^{(s)}-\sum_{s=1}^wE^{(s)}\right)^2}{\sum_{s=1}^wVar^{(s)}}
\end{displaymath}

gdzie:

$E^{(s)}$ jest rozwiązaniem równania kwadratowego (solution to the quadratic equation):

$\displaystyle\frac{E^{(s)}\left(O_{22}^{(s)}-O_{11}^{(s)}+E^{(s)}\right)}{\left(O_{11}^{(s)}+O_{21}^{(s)}-E^{(s)}\right)\left(O_{11}^{(s)}+O_{12}^{(s)}-E^{(s)}\right)}=OR_{MH}$,

$Var^{(s)}=\left(\frac{1}{E^{(s)}}+\frac{1}{O_{22}^{(s)}-O_{11}^{(s)}+E^{(s)}}+\frac{1}{O_{11}^{(s)}+O_{21}^{(s)}-E^{(s)}}+\frac{1}{O_{11}^{(s)}+O_{12}^{(s)}-E^{(s)}}\right)^{-1}$.

Statystyka ta ma asymptotycznie (dla dużych liczności) rozkład chi-kwadrat z liczbą stopni swobody wyliczaną według wzoru: $df=w-1$.

Wyznaczoną na podstawie statystyki testowej wartość $p$ porównujemy z poziomem istotności $\alpha$:

\begin{array}{ccl}
$ jeżeli $ p \le \alpha & \Longrightarrow & $ odrzucamy $ \mathcal{H}_0 $ przyjmując $ 	\mathcal{H}_1, \\
$ jeżeli $ p > \alpha & \Longrightarrow & $ nie ma podstaw, aby odrzucić $ \mathcal{H}_0. \\
\end{array}

Przykład (plik leptospiroza.pqs)

Przedstawiona tabela pokazuje hipotetyczne wyniki ankiety przeprowadzonej w celu wykrycia czynników ryzyka występowania leptospirozy wśród mieszkańców miasta i wsi Zachodnich Indii (gdzie obszar wiejski traktowany jest jako czynnik narażenia)9). Występowanie przeciwciał leptospirozy jest pośrednim dowodem na obecność zakażenia.

\begin{tabular}{|c|c||c|c|c|}
\hline
\multicolumn{2}{|c||}{Liczności obserwowane }& \multicolumn{2}{|c|}{przeciwciała leptospirozy}\\\cline{3-4}
\multicolumn{2}{|c||}{$O_{ij}$} & tak & nie\\\hline \hline
\multirow{3}{*}{miejsce zamieszkania}& wieś & 60 & 140\\\cline{2-4}
& miasto & 60 & 140 \\\hline
\end{tabular}

Szansa wystąpienia przeciwciał leptospirozy mieszkańców miasta i wsi jest taka sama (OR=1). Chcemy wiedzieć, jaka będzie szansa wystąpienia przeciwciał leptospirozy, gdy w analizie weźmiemy pod uwagę również płeć. Podzielimy więc próbę na 2 warstwy ze względu na płeć (są one zapamiętane w pliku jako zaznaczony zakres):

\begin{tabular}{|c|c||c|c|c|}
\hline
\multicolumn{2}{|c||}{Liczności obserwowane }& \multicolumn{2}{|c|}{przeciwciała leptospirozy}\\\cline{3-4}
\multicolumn{2}{|c||}{dla mężczyzn} & tak & nie\\\hline \hline
\multirow{3}{*}{miejsce zamieszkania}& wieś & 36 & 14\\\cline{2-4}
& miasto & 50 & 50 \\\hline
\end{tabular}

\begin{tabular}{|c|c||c|c|c|}
\hline
\multicolumn{2}{|c||}{Liczności obserwowane }& \multicolumn{2}{|c|}{przeciwciała leptospirozy}\\\cline{3-4}
\multicolumn{2}{|c||}{dla kobiet} & tak & nie\\\hline \hline
\multirow{3}{*}{miejsce zamieszkania}& wieś & 24 & 126\\\cline{2-4}
& miasto & 10 & 90 \\\hline
\end{tabular}

Płeć jest powiązana z obydwoma czynnikami (z występowaniem przeciwciał leptospirozy i z miejscem zamieszkania w Zachodnich Indiach). Jest to czynnik wikłający, którego zignorowanie może prowadzić do błędnych wyników.

Szansa wystąpienia przeciwciał leptospirozy jest większa dla mieszkańców wsi, zarówno dla kobiet (OR[95%CI]= 2.57[1.24, 5.34]) jak i dla mężczyzn (OR[95%CI]= 1.71[0.78, 3.76]). Tabele są homogeniczne (p=0.465049). Możemy zatem posłużyć się wyliczonym ilorazem szans wspólnym dla obu tabel ($OR_{MH}$[95%CI]=2.13[1.24, 3.65]). W rezultacie uzyskany wynik wskazuje, że szansa wystąpienia przeciwciał leptospirozy jest istotnie większa dla osób zamieszkujących tereny wiejskie (p=0.005169).

2014/08/22 20:00

Relatywne ryzyko Mantela-Haenszela

Jeśli wszystkie tabele (tworzone przez poszczególne warstwy) są homogeniczne (warunek ten można sprawdzić przy pomocy testu chi-kwadrat homogeniczności RR), wówczas na podstawie tych tabel można wyznaczyć wspólne relatywne ryzyko wraz z przedziałami ufności. Takie relatywne ryzyko jest średnią ważoną wartości Relatywnego Ryzyka wyznaczonego dla poszczególnych warstw. Zastosowanie ważonej metody zaproponowanej przez Mantela i Haenszela pozwala na uwzględnienie wkładu (wagi), jaki do budowy wspólnego Relatywnego Ryzyka wnosi każda warstwa (im bardziej liczna warstwa, tym większy ma wpływ na powstałe relatywne ryzyko).

Wagi dla każdej warstwy wyznacza się zgodnie z wzorem:

\begin{displaymath}
g^{(s)}=\frac{O_{21}^{(s)}\left(O_{11}^{(s)}+O_{12}^{(s)}\right)}{n^{(s)}},
\end{displaymath}

a relatywne ryzyko Mantela-Haenszela:

\begin{displaymath}
RR_{MH}=\frac{R}{S},
\end{displaymath}

gdzie:

$\displaystyle R=\sum_{s=1}^w\frac{O_{11}^{(s)}\left(O_{21}^{(s)}+O_{22}^{(s)}\right)}{n^{(s)}}$,

$\displaystyle S=\sum_{s=1}^wg^{(s)}$.

Przedział ufności dla $log RR_{MH}$ wyznacza się na podstawie błędu standardowego wyliczonego ze wzoru:

\begin{displaymath}
SE_{MH}=\sqrt{\frac{V}{RS}},
\end{displaymath}

gdzie:

$\displaystyle V=\sum_{s=1}^wV^{(s)}$,

$\displaystyle V^{(s)}=\frac{\left(O_{11}^{(s)}+O_{12}^{(s)}\right)\left(O_{21}^{(s)}+O_{22}^{(s)}\right)\left(O_{11}^{(s)}+O_{21}^{(s)}\right)-\left(O_{11}^{(s)}*O_{21}^{(s)}*n^{(s)}\right)}{\left(n^{(s)}\right)^2}$.

  • Test chi-kwadrat Mantela-Haenszela dla $RR_{MH}$

Test $\chi^2$ Mantela-Haenszela (ang. Mantel-Haenszel Chi-square test) służy do weryfikacji hipotezy o istotności wyznaczonego Relatywnego Ryzyka ($RR_{MH}$) i powinien być wyliczany przy dużych licznościach w tabeli kontyngencji.

Hipotezy:

\begin{array}{cl}
\mathcal{H}_0: & RR_{MH} = 1, \\
\mathcal{H}_1: & RR_{MH} \ne 1.
\end{array}

Statystyka testowa ma postać:

\begin{displaymath}
\chi^2_{MH}=\frac{\left(\sum_{s=1}^wO_{11}^{(s)}-\sum_{s=1}^wE_{11}^{(s)}\right)^2}{V},
\end{displaymath}

gdzie:

$E_{11}^{(s)}=\frac{\left(O_{11}^{(s)}+O_{21}^{(s)}\right)\left(O_{11}^{(s)}+O_{12}^{(s)}\right)}{n^{(s)}}$ to wartości oczekiwane w pierwszej komórce tabeli kontyngencji, dla poszczególnych warstw $s=1,2,...,w$.

Statystyka ta ma asymptotycznie (dla dużych liczności) rozkład chi-kwadrat z jednym stopniem swobody.

Wyznaczoną na podstawie statystyki testowej wartość $p$ porównujemy z poziomem istotności $\alpha$:

\begin{array}{ccl}
$ jeżeli $ p \le \alpha & \Longrightarrow & $ odrzucamy $ \mathcal{H}_0 $ przyjmując $ 	\mathcal{H}_1, \\
$ jeżeli $ p > \alpha & \Longrightarrow & $ nie ma podstaw, aby odrzucić $ \mathcal{H}_0. \\
\end{array}

  • Test chi-kwadrat homogeniczności dla $RR$

Test $\chi^2$ homogeniczności dla $RR$ (ang. Chi-square test of homogeneity for RR) służy do weryfikacji hipotezy o tym, że zmienna tworząca warstwy jest efektem modyfikującym, tzn. wpływa ona na wyznaczane relatywne ryzyko w taki sposób, że jest on znacząco inne dla poszczególnych warstw.

Hipotezy:

\begin{array}{cl}
\mathcal{H}_0: & RR_{MH} = RR^{(s)}, $ dla wszystkich warstw $s=1,2,...,w$,$ \\
\mathcal{H}_1: & RR_{MH} \ne RR^{(s)}, $ dla przynajmniej jednej warstwy.$
\end{array}

Statystyka testowa oparta o ważoną metodę najmniejszych kwadratów ma postać:

\begin{displaymath}
\chi^2=\sum_{s=1}^w v^{(s)}\left(\ln(RR^{(s)})-\ln(RR_{MH})\right)^2
\end{displaymath}

gdzie:

$v^{(s)}=\left(\frac{O_{12}^{(s)}}{O_{11}^{(s)}\left(O_{11}^{(s)}+O_{12}^{(s)}\right)}+\frac{O_{22}^{(s)}}{O_{21}^{(s)}\left(O_{21}^{(s)}+O_{22}^{(s)}\right)}\right)^{-1}$.

Statystyka ta ma asymptotycznie (dla dużych liczności) rozkład chi-kwadrat z liczbą stopni swobody wyliczaną według wzoru: $df=w-1$.

Wyznaczoną na podstawie statystyki testowej wartość $p$ porównujemy z poziomem istotności $\alpha$:

\begin{array}{ccl}
$ jeżeli $ p \le \alpha & \Longrightarrow & $ odrzucamy $ \mathcal{H}_0 $ przyjmując $ 	\mathcal{H}_1, \\
$ jeżeli $ p > \alpha & \Longrightarrow & $ nie ma podstaw, aby odrzucić $ \mathcal{H}_0. \\
\end{array}

2014/08/22 20:00
2014/08/22 20:00
1)
Mantel N. and Haenszel W. (1959), Statistical aspects of the analysis of data from retrospective studies of disease. Journal of the National Cancer Institute, 22,719-748
2)
Mantel N. (1963), Chi-square tests with one degree of freedom: Extensions of the Mantel-Haenszel procedure. J. Am. Statist. Assoc., 58, 690-700
3)
Newman S.C.(2001), Biostatistical Methods in Epidemiology. 2nd ed. New York: John Wiley
4)
Robins, J., Breslow, N., and Greenland S. (1986), Estimators of the Mantel–Haenszel variance consistent in both sparse data and large-strata limiting models. Biometrics 42, 311–323
5)
Robins, J., Greenland S. and Breslow, N.E. (1986), A general estimator for the variance of the Mantel–Haenszel odds ratio. American Journal of Epidemiology 124, 719–723
6)
Breslow N.E., Day N.E. (1980), Statistical Methods in Cancer Research: Vol. I - The Analysis of Case-Control Studies. Lyon: International Agency for Research on Cancer
7)
Breslow N.E. (1996), Statistics in epidemiology: the case-control study', Journal of the American Statistical Association, 91, 14-28
8)
Tarone R.E. (1985), On heterogeneity tests based on efficient scores. Biometrika 72, 91–95
9)
Betty R. Kirkwood and Jonathan A. C. Sterne (2003), Medical Statistics (2nd ed.). Meassachusetts: Blackwell Science, 177-188, 240-248