ANOVA Skillings-Mack (brakujących danych)

Analiza wariancji powtarzanych pomiarów dla rang Skillings-Mack została zaproponowana przez Skillings'a i Mack'a w roku 1981 1). Jest to test, który może być wykorzystywany w przypadku występowania braków danych, ale braki te nie muszą występować w żadnym szczególnym układzie. Każdy obiekt musi mieć jednak przynajmniej dwie obserwacje. Jeśli nie ma rang wiązanych a braki nie występują jest tożsamy z ANOVA Friedmana, a jeśli braki danych występują w układzie zbalansowanym odpowiada wynikom ANOVA Durbina.

Podstawowe warunki stosowania:

Hipotezy dotyczą równości sumy rang dla kolejnych pomiarów ($R_{j}$) lub są upraszczane do median ($\theta_j$):

\begin{array}{cl}
\mathcal{H}_0: & \theta_1=\theta_2=...=\theta_k,\\
\mathcal{H}_1: & $nie wszystkie $\theta_j$ są sobie równe $(j=1,2,...,k)$$,
\end{array}

Statystyka testowa ma postać:

\begin{displaymath}
\chi^2=A\Sigma_0^{-1}A^T
\end{displaymath}

gdzie:

$A=(A_1,A_2,...,A_{k-1}$

$A_j=\sum_{i=1}^n\sqrt{\frac{12}{s_i+1}}\left(R_{ij}-\frac{s_i+1}{2}\right)$,

$s_i$ - liczba obserwacji dla $i$-tego obiektu,

$R_{ij}$ - rangi przypisane kolejnym pomiarom ($j = 1, 2, ...k$), oddzielnie dla każdego z badanych obiektów ($i = 1, 2, ...n$), przy czym rangi dla braków danych równe są średniej randze dla danego obiektu,

$\Sigma_0$ - macierz wyznaczająca kowariancje dla $A$ przy prawdziwości $\mathcal{H}_0$2).

Gdy każda para pomiarów występuje równocześnie dla przynajmniej jednej obserwacji, statystyka ta ma asymptotycznie (dla dużych liczności) rozkład chi-kwadrat z $k-1$ stopniami swobody.

Wyznaczoną na podstawie statystyki testowej wartość $p$ porównujemy z poziomem istotności $\alpha$:

\begin{array}{ccl}
$ jeżeli $ p \le \alpha & \Longrightarrow & $ odrzucamy $ \mathcal{H}_0 $ przyjmując $ 	\mathcal{H}_1, \\
$ jeżeli $ p > \alpha & \Longrightarrow & $ nie ma podstaw, aby odrzucić $ \mathcal{H}_0. \\
\end{array}

Okno z ustawieniami opcji ANOVA Skillings-Mack wywołujemy poprzez menu StatystykaTesty nieparametryczneANOVA Friedmana (możliwość braków danych).

Uwaga!

By rekordy w których występują braki danych były brane pod uwagę wymagane jest zaznaczenie opcji Akceptuj braki danych. Jako braki danych traktowane są puste komórki oraz komórki o wartościach nieliczbowych. W analizie biorą udział tylko rekordy zawierające więcej niż jedną wartość liczbową.

Przykład (plik ankietyzacja.pqs)

Pewien nauczyciel akademicki, chcąc poprawić sposób prowadzenia zajęć postanowił zweryfikować swoje umiejętności dydaktyczne. W kilku losowo wybranych grupach studenckich, podczas ostatnich zajęć, prosił o wypełnienie krótkiej anonimowej ankiety. Ankieta składała się z 6 pytań dotyczących sposobu ilustrowania sześciu wyszczególnionych partii materiału. Studenci mogli dokonać oceny w skali pięciostopniowej , gdzie 1-zupełnie niezrozumiały sposób przedstawiana materiału, 5 - bardzo jasny i ciekawy sposób ilustrowania materiału. Uzyskane w ten sposób dane okazały się nie być kompletne ze względu na brak odpowiedzi studentów na pytania dotyczące tej części materiału, na której byli nieobecni. W 30-osobowej grupie wypełniającej ankietę, tylko 15 osób udzieliło kompletu odpowiedzi. Wykonanie analizy nie uwzględniającej braków danych (w tym przypadku analizy Friedmana) będzie miało ograniczoną moc poprzez tak drastyczne obcięcie liczności grupy i nie doprowadzi do wykrycia istotnych różnic. Braki danych nie były zaplanowane i nie występują w bloku zbalansowanym, a więc nie można wykonać tego zadania przy użyciu analizy Durbina wraz z jego testem POST-HOC.

Hipotezy:

$
\begin{array}{cl}
\mathcal{H}_0: & $brak jest istotnej różnicy w ocenach poszczególnych części materiału przez$\\
& $studentów, $\\
\mathcal{H}_1: & $przynajmniej jedna część materiału jest oceniana przez studentów inaczej.$
\end{array}
$

Wyniki analizy ANOVA Skillings-Mack przedstawia następujący raport:

Uzyskaną wartość $p$ należy traktować ostrożnie ze względu na możliwe rangi wiązane. Jednak w przypadku tego badania wartość $p=0.006739$ znajduje się znacznie poniżej przyjętego poziomu istotności $\alpha=0.05$, co świadczy o występowaniu istotnych różnic. Różnice w odpowiedziach można obserwować na wykresie, nie ma jednak możliwości przeprowadzenia analizy POST-HOC dla tego testu.

1) , 2)
Skillings J.H., Mack G.A. (1981) On the use of a Friedman-type statistic in balanced and unbalanced block designs. Technometrics, 23:171–177

Narzędzia witryny