Test Wilcoxona rangowanych znaków (ang. Wilcoxon signed-ranks test) znany również pod nazwą testu Wilcoxona dla pojedynczej próby, Wilcoxon (1945, 1949)1). Test ten służy do weryfikacji hipotezy, że badana próba pochodzi z populacji, dla której mediana () to znana wartość.
Podstawowe warunki stosowania:
Hipotezy dotyczą równości sumy rang dodatnich i ujemnych lub są upraszczane do median:
gdzie:
- mediana badanej cechy w populacji reprezentowanej przez badaną próbę,
- zadana wartość.
Wyznaczamy wartość statystyki testowej ( - dla małej liczności próby), a na jej podstawie wartość .
Porównujemy wartość z poziomem istotności :
Uwaga!
W zależności od wielkości próby statystyka testowa przyjmuje inną postać:
gdzie: i to odpowiednio: suma rang dodatnich i suma rang ujemnych.
Statystyka ta podlega rozkładowi Wilcoxona
gdzie: - liczba rangowanych znaków (liczba rang),
- liczba przypadków wchodzących w skład rangi wiązanej.
Wzór na statystykę testową zawiera poprawkę na rangi wiązane. Poprawka ta powinna być stosowana, gdy rangi wiązane występują (gdy nie ma rang wiązanych poprawka ta nie jest wyliczana, gdyż wówczas .
Statystyka ma asymptotycznie (dla dużych liczności) rozkład normalny.
Poprawka na ciągłość testu Wilcoxona (Marascuilo and McSweeney (1977)2))
Poprawkę na ciągłość stosujemy by zapewnić możliwość przyjmowania przez statystykę testową wszystkich wartości liczb rzeczywistych zgodnie z założeniem rozkładu normalnego. Wzór na statystykę testową z poprawką na ciągłość wyraża się wtedy wzorem:
Standaryzowana wielkość efektu
Rozkład statystyki testu Wilcoxona jest aproksymowany przez rozkłady normalny, który można przekształcić na wielkość efektu 3) by następnie uzyskać wartość d-Cohena zgodnie ze standardową konwersją stosowaną przy meta-analizach:
Przy interpretacji efektu badacze często posługują się ogólnymi, określonymi przez Cohena 4) wskazówkami definiującymi małą (0.2), średnią (0.5) i dużą (0.8) wielkość efektu.
Okno z ustawieniami opcji testu Wilcoxona (rangowanych znaków)
wywołujemy poprzez menu Statystyka
→Testy nieparametryczne
→Wilcoxon (rangowanych znaków)
lub poprzez ''Kreator''.
Przykład (plik kurier.pqs) c.d
Hipotezy:
Porównując wartość testu Wilcoxona opartego o statystykę z poziomem istotności stwierdzamy, że nie mamy podstaw by odrzucić hipotezę zerową mówiącą, że zwykle liczba dni oczekiwania na dostarczenie przesyłki przez analizowaną firmę kurierską wynosi 3. Taką samą decyzję podjęlibyśmy również na podstawie wartości lub testu Wilcoxona opartego o statystykę lub z poprawką na ciągłość.
Test zgodności (dobroci dopasowania) (ang. Chi-square goodnes-of-fit test) nazywany jest również testem dla pojedynczej próby, przeznaczony jest do testowania zgodności wartości obserwowanych dla () kategorii jednej cechy z hipotetycznymi wartościami oczekiwanymi dla tej cechy. Wartości wszystkich pomiarów należy zebrać w postaci tabeli składającej się z wierszy (kategorii: ). Dla każdej kategorii zapisuje się częstość jej występowania , oraz częstość dla niej oczekiwaną lub prawdopodobieństwo jej wystąpienia . Częstość oczekiwana jest wyznaczana jako iloczyn .
Utworzona tabela może przyjąć jedną z poniższych postaci:
Podstawowe warunki stosowania:
Hipotezy:
dla wszystkich kategorii,
dla przynajmniej jednej kategorii.
Statystyka testowa ma postać:
Statystyka ta ma asymptotycznie (dla dużych liczności oczekiwanych) rozkład chi-kwadrat z liczbą stopni swobody wyznaczaną według wzoru: .
Wyznaczoną na podstawie wartości statystyki i rozkładu wartość porównujemy z poziomem istotności :
Okno z ustawieniami opcji testu Chi-kwadrat zgodności
wywołujemy poprzez menu Statystyka
→Testy nieparametryczne
→Chi-kwadrat
lub poprzez ''Kreator''.
Chcielibyśmy się dowiedzieć, czy liczba wydawanych obiadów w kolejnych dniach tygodnia (od poniedziałku do piątku) w pewnej szkolnej stołówce jest statystycznie taka sama. W tym celu pobrano tygodniową próbę i zapisano dla niej liczbę wydanych obiadów w poszczególnych dniach: poniedziałek - 33, wtorek - 29, środa - 32, czwartek - 36, piątek - 20.}
Łącznie przez cały tydzień (5 dni) wydano 150 obiadów. Zakładamy, że w każdy dzień prawdopodobieństwo wydania obiadu jest takie samo, czyli wynosi . Oczekiwana liczba wydanych obiadów dla każdego z pięciu dni tygodnia wynosi więc .
Postawiono hipotezy:
Wartość z rozkładu dla 4 stopni swobody wynosi 0.287297. Zatem na poziomie istotności możemy powiedzieć, że nie mamy podstaw, aby odrzucić hipotezę zerową mówiącą o zgodności liczby wydawanych obiadów z oczekiwaną liczbą wydawanych obiadów w poszczególnych dniach.
Uwaga!
Gdybyśmy chcieli w ramach jednego badania dokonać większej liczby porównań, moglibyśmy zastosować poprawkę Bonferroniego 6) lub inną z poprawek opisanych w dziale Wielokrotne porównania. Ta poprawka jest używana by ograniczyć wielkość popełnionego błędu pierwszego rodzaju, gdy porównujemy wartości obserwowane i oczekiwane pomiędzy wybranymi dniami np:
Pt Pn,
Pt Wt,
Pt Śr,
Pt Czw,
przy założeniu, że porównania wykonujemy niezależnie. Poziom istotności dla każdego porównania wyznaczamy zgodnie z tą poprawką według wzoru: , gdzie to liczba wykonywanych porównań. Poziom istotności dla pojedynczego porównania zgodnie z poprawką Bonferroniego wynosi dla naszego przykładu .
Należy jednak pamiętać, że redukując dla każdego porównania zmniejszamy również moc testu.
Testy dla jednej proporcji stosujemy, gdy mamy do uzyskania dwa możliwe wyniki (jeden z nich to wynik wyróżniony o liczności ) i wiemy, jak często te wyniki pojawiają się w próbie (znamy proporcję ). W zależności od wielkości próby mamy do wyboru test dla jednej proporcji dla dużych prób oraz test dokładny dwumianowy dla prób o małej liczności. Testy te służą do weryfikacji hipotezy, że proporcja w populacji z której pochodzi próba to zadana wartość.
Podstawowe warunki stosowania:
Dodatkowy warunek dla testu dla jednej proporcji:
Hipotezy:
gdzie:
prawdopodobieństwo (wyróżniona proporcja) w populacji,
prawdopodobieństwo oczekiwane (proporcja oczekiwana).
Test dla jednej proporcji
Test dla jednej proporcji (ang. Z test for one proportion).
Statystyka testowa ma postać:
gdzie:
proporcja dla próby z tej populacji,
-liczność wartości wyszczególnionych w próbie,
- liczność próby.
Zmodyfikowana o poprawkę na ciągłość statystyka testowa ma postać:
Statystyka bez korekcji na ciągłość jak i z tą korekcją ma asymptotycznie (dla dużych liczności) rozkład normalny.
Test dwumianowy
Test dwumianowy (ang. Binominal test for one proportion) wykorzystuje w sposób bezpośredni rozkład dwumianowy zwany również rozkładem Bernoulliego, który należy do grupy rozkładów dyskretnych (czyli takich, w których badana zmienna przyjmuje skończoną liczbę wartości). Analizowana zmienna może przyjmować wartości, pierwszą oznaczaną zwykle mianem sukcesu a drugą porażki. Prawdopodobieństwo wystąpienia sukcesu to , a porażki .
Prawdopodobieństwo dla konkretnego punktu w tym rozkładzie wyliczane jest ze wzoru:
gdzie:
,
- liczność wartości wyszczególnionych w próbie,
- liczność próby.
Na podstawie sumy odpowiednich prawdopodobieństw wyznacza się wartość jednostronną i dwustronną, przy czym dwustronna wartość jest definiowana jako podwojona wartość mniejszego z jednostronnych prawdopodobieństw. Wartość porównujemy z poziomem istotności :
Uwaga!
Dla estymatora z próby jakim jest w tym przypadku wartość proporcji wyznacza się przedział ufności. Dla prób o dużej liczności można bazować na przedziałach opartych o rozkład normalny - tzw. przedziały Walda. Bardziej uniwersalne są natomiast przedziały zaproponowane przez Wilsona (1927)8) a także Agresti i Coull (1998)9). Przedziały Cloppera i Pearsona (1934)10) są dokładniejsze dla prób o mniejszej liczności.
Porównanie metod budowania przedziałów dla proporcji można znaleźć w pracy Brown L.D i innych (2001)11).
Okno z ustawieniami opcji testu Z dla jednej proporcji
wywołujemy poprzez menu Statystyka
→Testy nieparametryczne
→Z dla proporcji
.
Przykład c.d. (plik obiady.pqs)
Załóżmy, że chcielibyśmy sprawdzić, czy w piątek wydawana jest spośród wszystkich obiadów wydawanych w szkolnej stołówce w ciągu tygodnia. Dla pobranej próby , .
Przy ustawianiu opcji analizy włączamy filtr wybierając odpowiedni dzień tygodnia - czyli piątek. Brak ustawienia filtru nie generuje błędu a jedynie wyliczenie kolejnych statystyk dla kolejnych dni tygodnia.
Hipotezy:
Proporcja wartości wyróżnionych w próbie to a 95% przedział ufności Cloppera-Pearsona dla tej frakcji nie zawiera hipotetycznej wartości 0.2.
Na podstawie testu bez poprawki na ciągłość (=0.041227) jak i na podstawie dokładnej wartości prawdopodobieństwa wyliczonego z rozkładu dwumianowego (=0.044711) moglibyśmy przyjąć (na poziomie istotności ), że w piątek wydaje się statystycznie mniej niż obiadów wydawanych przez cały tydzień. Po zastosowaniu poprawki na ciągłość jednak nie udaje się odrzucić hipotezy zerowej (=0.052479).