Współczynnik korelacji liniowej Pearsona (ang. Pearson product-moment correlation coefficient, Pearson (1896,1900)) jest wykorzystywany do badania siły związku liniowego pomiędzy cechami. Można go wyznaczać dla skali interwałowej, o ile brak jest odstających pomiarów, a rozkład reszt lub badanych cech jest rozkładem normalnym.
gdzie:
- kolejne wartości cechy i ,
- średnie z wartości cechy i cechy ,
- liczność próby.
Uwaga!
oznacza współczynnik korelacji Pearsona populacji, natomiast w próbie.
Wartość interpretujemy w następujący sposób:
Interpretacja graficzna współczynnika .
Gdy jedna z badanych cech jest stała (niezależnie od zmian drugiej cechy) to nie są one związane zależnością. Współczynnika nie można wyznaczyć.
Uwaga!
Błędem jest wyznaczanie współczynnika korelacji, gdy w próbie występują obserwacje odstające, które mogą całkowicie przekłamać wartość i znak współczynnika korelacji Pearsona, gdy próba jest wyraźnie niejednorodna, bądź też badana zależność wyraźnie przyjmuje kształt inny niż liniowy.
Współczynnik determinacji - . Wyraża procent zmienności zmiennej zależnej tłumaczony zmiennością zmiennej niezależnej.
Tworzony model korelacji przedstawia zależność liniową postaci:
Współczynniki i równania regresji liniowej możemy wyznaczyć z wzorów:
Przykład c.d. (plik wiek-wzrost.pqs)