By otrzymać poprawny model regresji, powinniśmy sprawdzić podstawowe założenia dotyczące reszt modelu.
Badając reszty modelu szybko można uzyskać wiedzę na temat wartości odstających. Obserwacje takie mogą bardzo zaburzyć równanie regresji, ponieważ mają duży wpływ na wartości współczynników tego równania. Jeśli dana reszta
jest oddalona o więcej niż 3 odchylenia standardowe od wartości średniej, wówczas obserwacje taką można uznać za obserwacje odstającą. Usunięcie obserwacji odstającej może w znaczącym stopniu przyczynić się do poprawy modelu.
Odległość Cooka - opisuje wielkość zmian współczynników regresji powstałą na skutek pominięcia danego przypadku. W programie zaznaczone pogrubioną czcionką są odległości Cooka dla przypadków, które przekraczają 50 percentyl statystyki rozkładu Fishera-Snedecora F(0.5, k+1, n−k−1).
Odległość Mahalanobisa - dedykowana jest do wykrywania obserwacji odstających - wysokie wartości świadczą o znacznym oddaleniu danego przypadku od centrum zmiennych niezależnych. Jeśli wśród przypadków oddalonych o więcej niż 3 odchylenia znajdzie się przypadek o największej wartości Mahalanobisa, wówczas jako najbardziej odstający zostanie on zaznaczony pogrubioną czcionką.
Założenie to sprawdzamy wizualnie przy pomocy wykresu Q-Q rozkładu nromalnego. Duża różnica między rozkładem reszt a rozkładem normalnym może zaburzać ocenę istotności współczynników poszczególnych zmiennych modelu..
By sprawdzić czy istnieją obszary, gdzie wariancja reszt modelu jest zwiększona lub zmniejszona posługujemy się wykresami:
Aby zbudowany model można było uznać za poprawny, wartości reszt nie powinny być ze sobą skorelowane (dla wszystkich par
). Założenie to możemy sprawdzić wyliczając statystykę testu Durbina-Watsona
Aby sprawdzić dodatnią autokorelację na poziomie istotności
, sprawdzamy położenie statystyki
w stosunku do górnej (
) i dolnej (
) wartości krytycznej:
- błędy są dodatnio skorelowane;
- błędy nie są dodatnio skorelowane;
- wynik testu jest niejednoznaczny.
Aby sprawdzić ujemną autokorelację na poziomie istotności
, sprawdzamy położenie wartości
w stosunku do górnej (
) i dolnej (
) wartości krytycznej:
- błędy są ujemnie skorelowane;
- błędy nie są ujemnie skorelowane;
- wynik testu jest niejednoznaczny.
Wartości krytyczne testu Durbina-Watsona dla poziomu istotności
znajdują się na stronie internetowej (pqstat) - źródło tablic: Savina i White (1977)1)
Przykład c.d. (plik wydawca.pqs)