Test T-kwadrat Hotellinga dla grup niezależnych z korektą dla różnych wariancji

Poprawka dotyczy testu T-kwadrat Hotellinga dla grup niezależnych i jest wyliczana wówczas, gdy wariancje badanych zmiennych w obu populacjach są różne.

Statystyka testowa ma postać:

\begin{displaymath}
F=\frac{n-k}{k(n-1)}T^2
\end{displaymath}

gdzie:

$n=n_x+n_y-1$,

$n_x$, $n_y$ - liczności pierwszej i drugiej próby (liczności poszczególnych zmiennych równe) ,

$T^2 = (\overline{x}-\overline{y})^T\left(\frac{S_x}{n_x}+\frac{S_y}{n_y}\right)^{-1}(\overline{x}-\overline{y})$ - pierwotna statystyka testowa Hotellinga o rozkładzie $\chi^2$ (zalecana dla prób o dużych licznościach),

$\overline{x}=(\overline{x}_1, \overline{x}_2,..., \overline{x}_k)$ - średnie zmiennych w próbie pierwszej,

$\overline{y}=(\overline{y}_1, \overline{y}_2,..., \overline{y}_k)$ - średnie zmiennych w próbie drugiej,

$S_x$, $S_y$- macierz kowariancji dla pierwszej i drugiej próby.

Statystyka ta podlega rozkładowi F Snedecora z $k$ i $m$ stopniami swobody (gdzie $m$ to liczba stopni swobody skorygowana ze względu na różne wariancje).

Wyznaczoną na podstawie statystyki testowej wartość $p$ porównujemy z poziomem istotności $\alpha$:

\begin{array}{ccl}
$ jeżeli $ p \le \alpha & \Longrightarrow & $ odrzucamy $ \mathcal{H}_0 $ przyjmując $ 	\mathcal{H}_1, \\
$ jeżeli $ p > \alpha & \Longrightarrow & $ nie ma podstaw, aby odrzucić $ \mathcal{H}_0. \\
\end{array}

Gdy po wykonanej analizie szukamy zmiennych, których dotyczą różnice, wyznaczamy jednoczesne przedziały ufności dla różnic średnich

\begin{displaymath}
\overline{x}_j-\overline{y}_j\pm\sqrt{\frac{k(n-1)}{n-k}F_{\alpha,df_1,df_2}}\cdot SE_{(diff)_j}
\end{displaymath}

lub przedziały z poprawką Bonferroniego, w celu sprawdzenia czy znajduje się w nich wartość 0. Jeśli bowiem różnica może wynosić 0 to oznacza, że w rzeczywistości różnica pomiędzy badanymi wartościami może nie istnieć. Stosując tą metodę należy pamiętać, że wyznaczone przedziały nie uwzględniają powiązań pomiędzy zmiennymi (które uwzględnia test Hotellinga) a jedynie wielokrotne testowanie.

Szukając zmiennych, których dotyczą różnice możemy również zastosować podejście jednowymiarowe. Wykonujemy wówczas porównania testem t-Studenta z korektą Cochrana-Coxa oddzielnie dla poszczególnych zmiennych. Niestety, nie uwzględnimy tym samym wzajemnych powiązań, ale uzyskane wartości $p$ testu $t$-Studenta możemy skorygować w dziale Wielokrotne porównania.

Uwaga!

Zasada działania testu Hotellinga jest tożsama z budową „wielowymiarowych elips” przedziałów ufności wokół centrów wyznaczonych przez średnie (patrz przykład interpretacji elipsy testu Hotellinga dla pojedynczej próby). Przez co, stosując analizę jednowymiarową (nie uwzględniającą wzajemnych powiązań między zmiennymi) często nie jesteśmy w stanie uzyskać tożsamych wyników.

Okno z ustawieniami opcji testu Hotellinga dla grup niezależnych wywołujemy poprzez menu StatystykaTesty parametryczneT-kwadrat Hotellinga dla grup niezależnych.

Przykład (plik sport.pqs)

Przebadano grupę sportowców by uzyskać informację o parametrach zdrowotnych takich jak:

\begin{tabular}{ll}
RBC - Liczba czerwonych krwinek, & SSF - Suma fałdów skórno-tłuszczowych [mm],\\
WBC - Liczba białych krwinek, & \% Bfat - Zawartość tłuszczu w organizmie,\\
Hc - Hematokryt [\%], & LBM - Beztłuszczowa masa ciała [kg],\\
Hg - Hemoglobina [g/dl], & Wzrost [cm],\\
Ferr - Ferrytyna [µg/l], & Masa ciała [kg].
\end{tabular}

Chcemy wiedzieć, czy kobiety i mężczyźni, uprawiający zawodowo analizowane rodzaje sportu, różnią się poziomami tych parametrów.

Hipotezy:


$
\begin{array}{cl}
\mathcal{H}_0: & $średnie analizowanych parametrów są takie same dla kobiet$\\
& $i mężczyzn uprawiających analizowane rodzaje dyscyplinsportu,$\\
\mathcal{H}_1: & $przynajmniej jeden parametr ma inną średnią wartość$\\
& $dla porównywanych populacji.$\\
\end{array}
$

Ze względu na różnice dotyczące kowariancji analizowanych parametrów (wartość $p$ testu Boxa $<0.000001$) analizę przeprowadzamy przy włączonej korekcie różnych macierzy kowariancji.

Uzyskany wynik skorygowanej statystyki Hotellinga jest przedstawiony poniżej.

Porównując wartość $p<0.000001$ z poziomem istotności $\alpha=0.05$ stwierdzamy, że mężczyźni i kobiety w badanej populacji mają inne wartości średnie analizowanych parametrów. Według jednoczesnych przedziałów ufności (oraz według przedziałów z korektą Bonferroniego) różnice dotyczą:

RBC - średnio kobiety uzyskują niższe wartości,

Hc - średnio kobiety uzyskują niższe wartości,

Hg - średnio kobiety uzyskują niższe wartości,

Ferr - średnio kobiety uzyskują niższe wartości,

SSF - średnio mężczyźni uzyskują niższe wartości,

% Bfat - średnio mężczyźni uzyskują niższe wartości,

LBM - średnio kobiety uzyskują niższe wartości.

Pozostałe parametry czyli WBC, wzrost i masa ciała nie różnią się istotnie.

Podejście jednowymiarowe, choć nie uwzględniające wielokrotnego testowania ani wzajemnych powiązań, ze względu na swoją prostotę wykorzystywane jest najczęściej. Jego wyniki wskazują że różnice dotyczą wszystkich badanych parametrów za wyjątkiem WBC. Przy czym wyniki testu t-Studenta interpretujemy po uwzględnieniu korekty Cochrana-Coxa lub bez tej korekty, w zależności od spełnienia założenia równości wariancji (wynik testu Fishera-Snedecora). Chcąc uwzględnić wielokrotne testowania należałoby w tym przypadku zastosować jedną z korekt wartości p, opisanych w dziale Wielokrotne porównania.


Narzędzia witryny