Test Wilcoxona (rangowanych znaków)

Test Wilcoxona rangowanych znaków (ang. Wilcoxon signed-ranks test) znany również pod nazwą testu Wilcoxona dla pojedynczej próby, Wilcoxon (1945, 1949)1). Test ten służy do weryfikacji hipotezy, że badana próba pochodzi z populacji, dla której mediana ($\theta$) to znana wartość.

Podstawowe warunki stosowania:

Hipotezy dotyczą równości sumy rang dodatnich i ujemnych lub są upraszczane do median:


\begin{array}{cl}
\mathcal{H}_0: & \theta=\theta_0,\\
\mathcal{H}_1: & \theta\neq \theta_0.
\end{array}

gdzie:

$\theta$ - mediana badanej cechy w populacji reprezentowanej przez badaną próbę,

$\theta_0$ - zadana wartość.

Wyznaczamy wartość statystyki testowej $Z$ ($T$ - dla małej liczności próby), a na jej podstawie wartość $p$.

Porównujemy wartość $p$ z poziomem istotności $\alpha$:


\begin{array}{ccl}
$ jeżeli $ p \le \alpha & \Longrightarrow & $ odrzucamy $ \mathcal{H}_0 $ przyjmując $ 	\mathcal{H}_1, \\
$ jeżeli $ p > \alpha & \Longrightarrow & $ nie ma podstaw, aby odrzucić $ \mathcal{H}_0. 
\end{array}

Uwaga!

W zależności od wielkości próby statystyka testowa przyjmuje inną postać:

  • dla małej liczności próby
    \begin{displaymath}
T=\min\left(\sum R_-,\sum R_+\right),
\end{displaymath}


gdzie: $\sum R_+$ i $\sum R_-$ to odpowiednio: suma rang dodatnich i suma rang ujemnych.


Statystyka ta podlega rozkładowi Wilcoxona

  • dla próby o dużej liczności
    \begin{displaymath}
Z=\frac{T-\frac{n(n+1)}{4}}{\sqrt{\frac{n(n+1)(2n+1)}{24}-\frac{\sum t^3-\sum t}{48}}},
\end{displaymath}


gdzie: $n$ - liczba rangowanych znaków (liczba rang),
$t$ - liczba przypadków wchodzących w skład rangi wiązanej.

Wzór na statystykę testową $Z$ zawiera poprawkę na rangi wiązane. Poprawka ta powinna być stosowana, gdy rangi wiązane występują (gdy nie ma rang wiązanych poprawka ta nie jest wyliczana, gdyż wówczas $\left(\sum t^3-\sum t\right)/48=0$.

Statystyka $Z$ ma asymptotycznie (dla dużych liczności) rozkład normalny.

Poprawka na ciągłość testu Wilcoxona (Marascuilo and McSweeney (1977)2))

Poprawkę na ciągłość stosujemy by zapewnić możliwość przyjmowania przez statystykę testową wszystkich wartości liczb rzeczywistych zgodnie z założeniem rozkładu normalnego. Wzór na statystykę testową z poprawką na ciągłość wyraża się wtedy wzorem:
\begin{displaymath}
Z=\frac{\left|T-\frac{n(n+1)}{4}\right|-0.5}{\sqrt{\frac{n(n+1)(2n+1)}{24}-\frac{\sum t^3-\sum t}{48}}}.
\end{displaymath}

Okno z ustawieniami opcji testu Wilcoxona (rangowanych znaków) wywołujemy poprzez menu StatystykaTesty nieparametryczneWilcoxon (rangowanych znaków) lub poprzez ''Kreator''.

Przykład (plik kurier.pqs) c.d

Hipotezy:


\begin{array}{cl}
\mathcal{H}_0: & $mediana liczba dni oczekiwania na dostarczenie przesyłki przez analizowaną firmę $\\
&$kurierską wynosi 3$\\
\mathcal{H}_1: & $mediana liczba dni oczekiwania na dostarczenie przesyłki przez analizowaną firmę $\\
&$kurierską jest różna od 3$
\end{array}

Porównując wartość $p= 0.123212$ testu Wilcoxona opartego o statystykę $T$ z poziomem istotności $\alpha=0.05$ stwierdzamy, że nie mamy podstaw by odrzucić hipotezę zerową mówiącą, że zwykle liczba dni oczekiwania na dostarczenie przesyłki przez analizowaną firmę kurierską wynosi 3. Taką samą decyzję podjęlibyśmy również na podstawie wartości $p=0.111161$ lub $p=0.115817$ testu Wilcoxona opartego o statystykę $Z$ lub $Z$ z poprawką na ciągłość.

1)
Wilcoxon F. (1945), Individual comparisons by ranking methods. Biometries 1, 80-83
2)
Marascuilo L.A. and McSweeney M. (1977), Nonparametric and distribution-free method for the social sciences. Monterey, CA: Brooks Cole Publishing Company

Narzędzia witryny