statpqpl:aopisowapl:statopispl:miarrpl

Miary rozproszenia

Znajomość miar tendencji centralnej nie wystarcza do scharakteryzowania struktury zbiorowości statystycznej. Badana grupa może charakteryzować się różnym stopniem zmienności w zakresie badanej cechy. Potrzebne są zatem formuły pozwalające wyznaczyć wartości, które charakteryzują rozrzut danych.

Miary rozproszenia są liczone tylko dla skali interwałowej, ponieważ bazują one na odległościach między punktami.

Rozstęp (ang. range) wyraża się wzorem:

$\begin{displaymath} I=\max x_i - \min x_i \label{rozstep}, \end{displaymath}$

gdzie $x_i$ to wartości badanej zmiennej

$\begin{displaymath} IQR=\textrm{rozstęp kwartylowy}=Q_3-Q_1 \label{rozstepkw}, \end{displaymath}$

gdzie $Q_1, Q_3$ to dolny i górny kwartyl.

Rozstępy dla skali percentylowej (decylowej, centylowej). Rozstępy miedzy percentylami to jedna z miar rozproszenia i określa procent wszystkich obserwacji, których wartość znajduje się pomiędzy wybranymi percentylami.

Wariancja (ang. variance) - mierzy stopień rozproszenia pomiarów wokół średniej arytmetycznej

wariancja z próby:
$\begin{displaymath} sd^2=\displaystyle{\frac{\sum_{i=1}^{n}(x_i-\overline{x})^2}{n-1}}, \label{wariancja} \end{displaymath}$

gdzie $x_i$ to kolejne wartości zmiennej a $\overline{x}$ to średnia arytmetyczna tych wartości, $n$ - liczność próby.

wariancja z populacji:
$\begin{displaymath} \sigma^2=\displaystyle{\frac{\sum_{i=1}^{N}(x_i-\mu)^2}{N}}, \label{wariancja} \end{displaymath}$

gdzie $x_i$ to kolejne wartości zmiennej a $\mu$ to średnia arytmetyczna tych wartości, $N$ - liczność populacji.

Wariancja jest zawsze dodatnia, ale nie jest wyrażona w tych samych jednostkach co wyniki pomiarów.

Odchylenie standardowe (ang. standard deviation) $-$ mierzy stopień rozproszenia pomiarów wokół średniej arytmetycznej.

odchylenie standardowe z próby:
$\begin{displaymath} sd=\sqrt{sd^2}, \label{odch.standard} \end{displaymath}$
odchylenie standardowe z populacji:
$\begin{displaymath} \sigma=\sqrt{\sigma^2}. \end{displaymath}$

Im wyższa wartość odchylenia standardowego lub wariancji, tym bardziej zróżnicowana grupa pod względem badanej cechy.

Uwaga! Odchylenie standardowe z próby jest pewnym przybliżeniem (estymatorem) odchylenia standardowego z populacji. Populacyjna wartość odchylenia standardowego mieści się w pewnym przedziale zawierającym odchylenie standardowe z próby. Przedział ten nazywany jest przedziałem ufności (confidence interval) dla odchylenia standardowego.

Współczynnik zmienności (ang. coefficient of variation)
Współczynnik zmienności podobnie jak odchylenie standardowe pozwala na ocenę stopnia jednorodności badanej zbiorowości. Wyraża się wzorem:
$\begin{displaymath} V=\frac{sd}{\overline{x}}100\% , \label{wspzmienn} \end{displaymath}$

gdzie $sd$ to odchylenie standardowe, $\overline{x}$ to średnia arytmetyczna.

Jest to wielkość niemianowana. Pozwala on na ocenę zróżnicowania kilku zbiorowości pod względem tej samej cechy oraz tej samej zbiorowości pod względem kilku różnych cech (wyrażonych w różnych jednostkach). Przyjmuje się, że jeżeli współczynnik $V$ nie przekracza 10\%, to cechy wykazują zróżnicowanie statystycznie nieistotne.

Błędy standardowe (ang. standard errors) - nie są miarami rozproszenia wyników pomiarowych, lecz określają stopień dokładności z jaką możemy określić wartości parametrów populacji na podstawie wyznaczenia ich estymatorów dla próby.

Błąd średniej arytmetycznej (ang. standard error of the mean) wyraża się następującym wzorem: $\begin{displaymath} SEM=\textrm{błąd standardowy średniej}=\frac{sd}{\sqrt{n}} \label{sem}. \end{displaymath}$

Uwaga! Na podstawie błędu standardowego estymatora z próby można określić przedział ufności dla parametru populacji.