Weryfikacja hipotez statystycznych wykonywana jest w kilku krokach:
: nie ma ważnej statystycznie różnicy między (średnimi, medianami, proporcjami , rozkładami, itp.) populacji,
: istnieje ważna statystycznie różnica między (średnimi, medianami, proporcjami , rozkładami, itp.) populacji.
Badacz tak musi sformułować hipotezę, by była zgodna z rzeczywistością i wymogami testu statystycznego, np.:
: odsetek kobiet i mężczyzn prowadzących działalność gospodarczą w badanej populacji jest taki sam.
Jeśli nie wiemy, który odsetek (kobiet czy mężczyzn) w badanej populacji mógłby być większy, wówczas hipoteza alternatywna powinna być dwustronna, tzn. nie zakładamy kierunku:
: odsetek kobiet i mężczyzn prowadzących działalność gospodarczą w badanej populacji jest różny.
Może się zdarzyć (są to bardzo rzadkie przypadki), że mamy pewność, iż znamy kierunek w hipotezie alternatywnej. Wówczas można zastosować jednostronną hipotezę alternatywną.
Uwaga 1!
Wybór testu statystycznego wiąże się przede wszystkim z wyborem odpowiedniej skali pomiarowej (interwałowej, porządkowej, nominalnej) jaką reprezentują analizowane dane, oraz z wyborem modelu badania (model zależny, model niezależny)
Pomiary danej cechy nazywamy zależnymi (powiązanymi), gdy są wykonane kilkukrotnie dla tych samych obiektów. Gdy pomiary danej cechy dokonane są na obiektach należących do różnych grup, wówczas mówimy że są to grupy niezależnych (niepowiązanych) pomiarów.
Przykłady badań w grupach zależnych:
Badanie masy ciała pacjentów przed i po terapii odchudzającej, badanie reakcji na bodziec tej samej grupy obiektów ale w dwóch różnych warunkach (np. w nocy i w dzień), badanie zgodności oceny zdolności kredytowej określonej przez 2 różne banki ale na tej samej grupie klientów itp.
Przykłady badań w grupach niezależnych:
Badanie masy ciała w grupie pacjentów zdrowych i grupie pacjentów chorych, badanie efektywności nawożenia kilku różnych rodzajów nawozów, badanie wielkości PKB dla różnych krajów itp.
Uwaga 2!
Zawarty w oknie Kreatora graf ułatwia wybór odpowiedniego testu statystycznego.
Statystyka testowa wybranego testu wyliczana zgodnie z jej wzorem podlega odpowiedniemu dla niej rozkładowi teoretycznemu.
Program wylicza wartość statystyki testowej, oraz wartość dla tej statystyki (czyli część pola pod krzywą, która odpowiada wartości statystyki testowej). Wartość pozwala wybrać spośród hipotezy zerowej i alternatywnej tę bardziej prawdopodobną. Przy czym zawsze zakładamy prawdziwość hipotezy zerowej, a zebrane w danych dowody mają dostarczyć wystarczającej ilości argumentów przeciwko tej hipotezie:
Zwykle wybiera się poziom istotności , zgadzając się, że w 5% sytuacji odrzucimy hipotezę zerową gdy jest ona prawdziwa. W szczególnych przypadkach można wybrać inny poziom istotności np. 0.01 lub 0.001.
Uwaga!
Test statystyczny może nie być zgodny z rzeczywistością w dwóch przypadkach:
Możemy popełnić 2 rodzaje błędów:
Moc testu to .
Wartości i są z sobą związane. Przyjętą praktyką jest ustalenie z góry poziomu istotności i minimalizacja poprzez zwiększanie rozmiaru próby.