statpqpl:metapl:heterog

Badanie heterogeniczności

Trudno oczekiwać by każde badanie kończyło się uzyskaniem dokładnie tej samej wielkości efektu. W naturalny sposób uzyskane w różnych pracach wyniki będą nieco inne. Badanie heterogeniczności ma ustalić na ile pojawiające się różnice pomiędzy uzyskanymi w różnych pracach efektami mają wpływ na budowany w meta-analizie efekt sumaryczny. Efekt sumaryczny dobrze podsumowuje wyniki uzyskane w poszczególnych pracach, jeśli różnice między poszczególnymi efektami są naturalne tzn. nieduże. Duże różnice w obserwowanych efektach mogą świadczyć o niejednorodności badań i konieczności wydzielenia bardziej homogenicznych podgrup np. podzielenia zebranych prac na kilka podgrup względem dodatkowego czynnika. Dla przykładu: dany lek inaczej działa na osoby młodsze a inaczej na starszych, więc w pracach opartych na danych pochodzących głównie od osób młodych uzyskiwany efekt może znacznie odbiegać od prac przeprowadzanych na osobach starszych. Podzielenie zebranych prac na bardziej jednorodne podgrupy pozwoli na dobre oszacowanie efektu sumarycznego dla każdej z tych podgrup oddzielnie.

Badanie heterogeniczności ma na celu sprawdzenie czy zmienność pomiędzy badaniami jest zerowa.

Hipotezy:

$\begin{array}{cl} \mathcal{H}_0: & \tau^2 = 0,\\ \mathcal{H}_1: & \tau^2 \ne 0, \end{array}$

gdzie:

$\tau^2$ - to wariancja prawdziwych (populacyjnych) efektów poszczególnych badań.

Statystyka testowa ma postać: $\begin{displaymath} Q=T^2W+k-1 \end{displaymath}$

gdzie:

$T^2$ - to wariancja obserwowanych efektów,

$W$ - współczynnik wyliczony na podstawie wag przypisanych do poszczególnych badań,

$k$ - liczba badań.

Statystyka ta ma asymptotycznie (dla dużych liczności) rozkład chi-kwadrat z liczbą stopni swobody wyliczaną według wzoru: $df=k-1$ .

Wyznaczoną na podstawie statystyki testowej wartość $p$ porównujemy z poziomem istotności poziomem istotności $\alpha$ :

$\begin{array}{ccl} $ jeżeli $ p \le \alpha & \Longrightarrow & $ odrzucamy $ \mathcal{H}_0 $ przyjmując $ \mathcal{H}_1, \\ $ jeżeli $ p > \alpha & \Longrightarrow & $ nie ma podstaw, aby odrzucić $ \mathcal{H}_0. \\ \end{array}$

Uwaga!

Jeśli uzyskamy wynik jest istotny statystycznie - jest to mocna sugestia, by zrezygnować z wspólnego podsumowywania wszystkich zebranych badań.
Jeśli uzyskany wynik jest nieistotny statystycznie - możemy podsumować badania wspólnym efektem. Przy czym sugeruje się, by podsumowania dokonywać zwykle efektem zmiennym - zgodnie z poniższym uzasadnieniem.

Uzasadnienie wyboru efektu zmiennego:

Podsumowanie badania efektem zmiennym bierze pod uwagę zmienność pomiędzy badaniami ( $T^2$ ), natomiast podsumowanie efektem stałym nie bierze pod uwagę tej zmienności. Jeśli jednak $T^2$ jest małe, to wynik działania modelu z efektem stałym będzie bliski wynikom działania modelu z efektem zmiennym, a gdy $T^2=0$ , oba modele dadzą dokładnie ten sam wynik.

Dodatkowymi miarami opisującymi heterogeniczność są współczynniki $I^2$ i $H^2$ :

$\begin{displaymath} I^2=\frac{H^2-1}{H^2},\\ H^2=\frac{Q}{k-1}. \end{displaymath}$

Współczynnik $I^2$ określa procent obserwowanej wariancji, jaki wynika z rzeczywistej różnicy w wielkości badanych efektów (graficznie, odzwierciedla stopień zazębiania się przedziałów ufności poszczególnych badań). Ze względu na to, że mieści się on pomiędzy 0% a 100%, podlega prostej interpretacji i jest chętnie stosowany. Jeśli $I^2=0$ , wówczas cała obserwowana wariancja wielkości efektów jest „fałszywa”, więc jeśli w wyznaczonym wokół współczynnika $I^2$ przedziale ufności znajdzie się wartość 0, uzyskaną wariancję można uznać za nieistotną statystycznie. Natomiast czym wartość $I^2$ jest bliższa 100%, tym bardziej należy się zastanowić nad rezygnacją z wspólnego podsumowania badań. Przyjmuje się, że $I^2\approx 25\%$ oznacza słabą, $I^2\approx 50\%$ średnią, a $I^2\approx 75\%$ silną heterogeniczność badań. Współczynnik $H^2$ rozpatruje się natomiast w odniesieniu do wartości 1. Jeśli przedział ufności dla $H^2$ zawiera wartość 1, wówczas uzyskaną wariancję można uznać za nieistotną statystycznie, a im wyższa wartość $H^2$ , tym większa heterogeniczność badań.

Przykład c.d. (plik MetaanalizaRR.pqs)

Badając wpływ palenia papierosów na wystąpienie choroby X sprawdzono założenie dotyczące heterogeniczności badań. W tym celu, w oknie analizy wybrano opcję Badanie heterogeniczności.

Uzyskano istotny statystycznie wynik statystyki Q (p=0.04284). Wariancja obserwowanych efektów nie jest zerowa (T2=0.0058), a współczynnik I2=48.27%, wskazuje na przeciętną heterogeniczność badań. Jedynie przedział ufności dla współczynnika H2 uznaje za nieistotną zmienność pomiędzy badaniami (przedział dla tego współczynnika to [0.93-4.00]). Mając na uwadze powyższe wyniki, należy się zastanowić, czy zebrane prace mogą być podsumowane jednym wspólnym efektem końcowym (wspólnym relatywnym ryzykiem), czy też warto wyznaczyć bardziej homogeniczną grupę prac i przeprowadzić analizę ponownie.