Jednowymiarowy jądrowy estymator gęstości pozwala na przybliżenie gęstości rozkładu danych tworząc wygładzoną krzywą gęstości w sposób nieparametryczny. Dzięki niemu uzyskuje się lepszą estymację gęstości niż daje tradycyjny histogram, którego kolumny tworzą funkcję schodkową.
Estymator jądrowy definiowany jest w oparciu o odpowiednio wygładzone jądro . Parametr wygładzania (ang. bandwidth) ma decydujący wpływ na uzyskany estymator. Im wyższa wartość parametru wygładzania, tym stopień wygładzenia jest większy.
Dla każdego punktu z zakresu określonego przez dane wyznacza się gęstość czyli podaje wartość estymatora jądrowego w tym punkcie. Estymator ten powstaje poprzez zsumowanie wartości funkcji jąder w tym punkcie:
Jeśli poszczególnym przypadkom nadamy wagi , wówczas możemy zbudować ważony jądrowy estymator gęstości definiowany wzorem:
Współczynniki wygładzania
Dla jądra innego niż Gaussa, współczynnik wygładzania podlega skalowaniu (Scott D. W., 19924))
Dla jądra innego niż Gaussa, współczynnik wygładzania podlega skalowaniu (Scott D. W., 19927))
Dla jądra innego niż Gaussa, współczynnik wygładzania podlega skalowaniu (Scott D. W., 199210))
Funkcja jądra w mniejszym zakresie niż parametr wygładzania wpływa na uzyskaną wartość estymatora jądrowego. Jądro jest funkcją gęstości prawdopodobieństwa budowaną wokół każdego punktu danych . Zwykle jest to funkcja symetryczna osiągająca maksimum w punkcie , a zmniejszająca swoje wartości wraz z oddalaniem się (wzrostem odległości ) od tego punktu. Odległość od analizowanego punktu jest modyfikowana przez parametr wygładzania zgodnie z wzorem: .
W zależności od potrzeb funkcja jądra może przyjmować postać funkcji:
Przykład (plik BMI.pqs)
Wyliczono wartości współczynnika wagowo-wzrostowego BMI1 dla pewnej grupy osób otyłych. Przedstawiono ich rozkład za pomocą histogramu z podziałem wartości co 1 jednostkę BMI. Dane zobrazowano również za pomocą jądrowego estymatora gęstości wybierając Gaussowską funkcję jądra i ustawiając współczynniki wygładzania odpowiednio: 0.5, 1, 2.
Współczynniki wygładzania estymatora jądrowego sugerowane przez metody SROT, SNR i OS osiągają wielkości pomiędzy 1.4 a 2.