Rzeczywisty rozkład danych z próby - rozkład empiryczny danych może być przedstawiony za pomocą Tabel liczności (poprzez wybranie menu Statystyka
→Analizy opisowe
→Tabele liczności
). Na przykład rozkład ilości wykorzystanych darmowych minut przez abonentów pewnego operatora telefonii komórkowej.
Przykład (plik: rozkład.pqs) przedstawia następująca tabela:
Graficzna prezentacja wyników uzyskanych w raporcie tabeli zwykle dokonywana jest przy pomocy histogramu czy też wykresu kolumnowego.
Wykres taki możemy uzyskać zaznaczając w oknie Tabel licznosci
opcje Dołącz wykres
.
Rozkład teoretyczny danych zwany również rozkładem prawdopodobieństwa graficznie przedstawiany jest zwykle przy pomocy wykresu liniowego. Taka linia opisana jest funkcją (modelem matematycznym) i zwana funkcją gęstości rozkładu. Odpowiednim rozkładem teoretycznym można zastąpić rozkład empiryczny.
Uwaga! Do zastąpienia rozkładu empirycznego rozkładem teoretycznym nie wystarczy intuicyjne stwierdzenie podobieństwa ich przebiegu. Służą do tego specjalnie skonstruowane testy zgodności z tym rozkładem.
Najczęściej używanym rozkładem prawdopodobieństwa jest rozkład normalny (rozkład Gaussa), i taki rozkład o średniej 161.15 i odchyleniu standardowym równym 13.03 prezentują dane na temat ilości wykorzystanych darmowych minut (Przykład plik: rozkład.pqs). 1
Funkcja gęstości jest zdefiniowana jako:
gdzie:
,
wartość oczekiwana populacji (której miarą jest średnia),
odchylenie standardowe.
Rozkład normalny jest rozkładem symetrycznym względem prostej prostopadłej do osi odciętych i przechodzącej przez punkt wyznaczający średnią, modę oraz medianę.
Rozkład normalny o średniej i (), to tzw. rozkład normalny standaryzowany.
Funkcja gęstości jest zdefiniowana jako:
gdzie:
,
stopnie swobody (liczność próby pomniejszona o liczbę ograniczeń w określonych obliczeniach),
to funkcja Gamma.
Funkcja gęstości jest zdefiniowana jako:
gdzie:
,
stopnie swobody (liczność próby pomniejszona o liczbę ograniczeń w określonych obliczeniach),
to funkcja Gamma.
Funkcja gęstości jest zdefiniowana jako:
gdzie:
,
, stopnie swobody (przyjmuje się, że jeżeli i są niezależne o rozkładzie z odpowiednio i stopniami swobody, to ma rozkład F Snedecora ),
to funkcja Beta.
Pole pod krzywą (funkcją gęstości rozkładu) to prawdopodobieństwo wystąpienia wszystkich możliwych wartości badanej zmiennej losowej. Całe pole pod krzywą wynosi . Gdy chcemy zbadać wielkość tylko części tego pola musimy podać wartość graniczną zwaną wartością krytyczną lub Statystyką
. Korzystamy w tym celu z okna Kalkulatora funkcji dystrybucji
. W oknie tym jest możliwe wyliczanie wartości pola pod krzywą (Wartość
) zadanego rozkładu na podstawie Statystyki
, jak też wyznaczanie wartości Statystyki
na podstawie Wartości
. Okno Kalkulatora funkcji dystrybucji
uruchamiamy poprzez wybranie menu Statystyka
→Kalkulatory
→Kalkulator funkcji dystrybucji
Kalkulator funkcji dystrybucji
Pewien operator telefonii komórkowej przeprowadza szereg badań dotyczących wykorzystania przez klientów ilości przyznanych w abonamencie „darmowych minut”. Na podstawie 200 osobowej próby swoich klientów (w której rozkład wykorzystanych „darmowych minut” przyjmuje kształt rozkładu normalnego) wyznaczył wartość średnią i odchylenie standardowe Chcemy wyliczyć prawdopodobieństwo, że wylosowany przez nas klient wykorzystał:
Uruchamiamy okno Kalkulatora funkcji dystrybucji
, wybieramy rozkład Gaussa
i wpisujemy średnią
i odchylenie st.
oraz zaznaczamy, że będziemy wyliczać Wartość
.
Statystyka
wpisujemy wartość 150. Wybrane ustawienia potwierdzamy przyciskiem Oblicz
.
Uzyskana Wartość
wynosi 0.193961.
Uwaga!
Podobne obliczenia możemy wykonać na podstawie rozkładu empirycznego. Wystarczy wówczas przy pomocy okna Tabele liczności
wyznaczyć procent klientów wykorzystujących 150 minut lub mniej (patrz przykład (\ref{tab_licznosci}), plik: rozkład.pqs). W badanej 200 osobowej próbie klientów wykorzystujących 150 minut lub mniej jest 40, co stanowi 20\% próby a zatem szukane prawdopodobieństwo wynosi .
Statystyka
wpisujemy wartość 150 i zaznaczamy opcję 1- Wartość
. Wybrane ustawienia potwierdzamy przyciskiem Oblicz
.
Uzyskana Wartość
wynosi 0.806039.
Statystyka
wpisujemy jedną z końcowych wartości przedziału, a następnie zaznaczamy opcję dwustronnie
. Wybrane ustawienia potwierdzamy przyciskiem Oblicz
.
Uzyskana Wartość
wynosi 0.682689.
Statystyka
wpisujemy jedną z końcowych wartości przedziału, a następnie zaznaczamy opcje: dwustronnie
i 1-wartość
. Wybrane ustawienia potwierdzamy przyciskiem Oblicz
.
Uzyskana Wartość
wynosi 0.317311.
Proces uogólnienia wyników otrzymanych dla próby na całą populację dzieli się zasadniczo na 2 części: