Test t-Studenta dla pojedynczej próby

Test t-Studenta dla pojedynczej próby (ang. single-sample t test) służy do weryfikacji hipotezy, że badana próba o średniej $\overline{x}$ pochodzi z populacji dla której średnia $\mu$ to zadana wartość.

Podstawowe warunki stosowania:

Hipotezy:


$\begin{array}{cc}\\
\mathcal{H}_0: & \mu=\mu_0,\\
\mathcal{H}_1: & \mu\ne \mu_0,
\end{array}$

gdzie:
$\mu$ - średnia cechy w populacji reprezentowanej przez próbę,
$\mu_0$ - zadana wartość.

Statystyka testowa ma postać: \begin{displaymath}
t=\frac{\overline{x}-\mu_0}{sd}\sqrt{n},
\end{displaymath}

gdzie: $sd$ - odchylenie standardowe z próby,
$n$ - liczność próby.

Statystyka testowa ma rozkład t-Studenta z $n-1$ stopniami swobody.

Wyznaczoną na podstawie statystyki testowej wartość $p$ porównujemy z poziomem istotności $\alpha$:


$ \begin{array}{ccl}
$ jeżeli $ p \le \alpha & \Longrightarrow & $ odrzucamy $ \mathcal{H}_0 $ przyjmując $ 	\mathcal{H}_1, \\
$ jeżeli $ p > \alpha & \Longrightarrow & $ nie ma podstaw, aby odrzucić $ \mathcal{H}_0. 
\end{array}$

Uwaga!

Gdy próba jest duża i znane jest odchylenie standardowe z populacji wówczas statystykę testową można wyznaczyć z wzoru: \begin{displaymath}
t=\frac{\overline{x}-\mu_0}{\sigma}\sqrt n.
\end{displaymath} Tak wyznaczona statystyka testowa ma rozkład normalny. Przy $n \rightarrow \infty$ rozkład $t$-Studenta jest zbieżny do rozkładu normalnego $N(0,1)$. W praktyce przyjmuje się, że dla $n>30$ rozkład $t$-Studenta można aproksymować rozkładem normalnym.

Standaryzowana wielkość efektu

Współczynnik d-Cohena określa jak dużą częścią występującej zmienności jest różnica między średnimi.

\begin{displaymath}
	d=\left|\frac{\overline{x}-\mu_0}{sd}\right|
\end{displaymath}

Przy interpretacji efektu badacze często posługują się ogólnymi, określonymi przez Cohena 1) wskazówkami definiującymi małą (0.2), średnią (0.5) i dużą (0.8) wielkość efektu.

Okno z ustawieniami opcji testu t-Studenta dla pojedynczej próby wywołujemy poprzez menu StatystykaTesty parametrycznet-Student lub poprzez ''Kreator''.

Uwaga!

Obliczenia mogą bazować na danych w postaci surowych rekordów lub danych uśrednionych tzn. średniej arytmetycznej, odchyleniu standardowym i liczności próby.

Przykład (plik kurier.pqs)

Chcemy sprawdzić, czy czas oczekiwania na dostarczenie przesyłki przez pewna firmę kurierską to przeciętnie 3 dni $(\mu_0=3)$. W tym celu z populacji klientów tej firmy wylosowano próbę liczącą 22 osoby i zapisano informacje o liczbie dni, jakie minęły od dnia nadania przesyłki do jej dostarczenia, były to następujące wielkości: (1, 1, 1, 2, 2, 2, 2, 3, 3, 3, 4, 4, 4, 4, 4, 5, 5, 6, 6, 6, 7, 7).}

Liczba dni oczekiwania na przesyłkę w badanej populacji spełnia założenie normalności rozkładu.

Hipotezy:


$
\begin{array}{cl}
\mathcal{H}_0: & $średnia liczba dni oczekiwania na dostarczenie przesyłki przez analizowaną firmę $\\
&$kurierską wynosi 3,$\\
\mathcal{H}_1: & $średnia liczba dni oczekiwania na dostarczenie przesyłki przez analizowaną firmę $\\
&$kurierską jest różna od 3.$
\end{array}
$

Porównując wartość $p= 0.088074$ testu $t$-Studenta z poziomem istotności $\alpha=0.05$ stwierdzamy, że nie ma podstaw by odrzucić hipotezę zerową mówiącą, że średnia liczba dni oczekiwania na dostarczenie przesyłki przez analizowaną firmę kurierską wynosi 3. Dla badanej próby średnia to $\overline{x}=3.727$ a odchylenie standardowe $sd=1.907$.

1)
Cohen J. (1988), Statistical Power Analysis for the Behavioral Sciences, Lawrence Erlbaum Associates, Hillsdale, New Jersey