Ocena testu diagnostycznego

Załóżmy, że przy pomocy testu diagnostycznego badamy występowanie danej cechy (najczęściej choroby) i znamy rzeczywistość (tzw. gold-standard) czyli wiemy, czy ta cecha rzeczywiście występuje u badanych osób. Na podstawie tych informacji możemy zbudować tabelę kontyngencji $2\times2$:

\begin{tabular}{|c|c||c|c|c|}
\hline
\multicolumn{2}{|c||}{Liczności  obserwowane}& \multicolumn{3}{|c|}{Rzeczywistość (gold-standard)} \\\cline{3-5}
\multicolumn{2}{|c||}{ }&choroba \textbf{(+)}&brak choroby \textbf{($-$)}& \textbf{Suma}\\ \hline \hline
\multirow{3}{*}{test diagnostyczny} & wynik pozytywny \textbf{(+)} & TP & FP & TP+FP \\\cline{2-5}
&wynik negatywny \textbf{($-$)}& FN &TN & FN+TN\\\cline{2-5}
&\textbf{Suma} & TP+FN & FP+TN & n=TP+FP+FN+TN\\\hline
\end{tabular}

gdzie:

TP - wyniki prawdziwie dodatnie (ang. true positive)

FP - wyniki fałszywie dodatnie (ang. false positive)

FN - wyniki fałszywie ujemne (ang. false negative)

TN - wyniki prawdziwie ujemne (ang. true negative)

Dla takiej tabeli możemy wyliczyć podane niżej miary.

  • Czułość i swoistość testu diagnostycznego

Każdy test diagnostyczny może w niektórych przypadkach uzyskać wyniki różne od wyników rzeczywistych, na przykład test diagnostyczny na podstawie otrzymanych parametrów klasyfikuje pacjenta do grupy osób chorych na daną chorobę, bądź zdrowych. W rzeczywistości ilość osób zakwalifikowanych do powyższych grup przez test może się różnić od ilości osób rzeczywiście zdrowych i rzeczywiście chorych.

Stosowane są dwie miary oceny trafności testu diagnostycznego. Są to:

  • Czułość (ang. sensitivity) - opisuje zdolność wykrywania osób rzeczywiście chorych (posiadających daną cechę). Jeśli więc badamy grupę osób chorych, to czułość daje nam informacje jaki procent z nich ma pozytywny wynik tetsu.

\begin{displaymath}
\textrm{czułość}=\frac{TP}{TP+FN}
\end{displaymath}

Przedział ufności budowany jest w oparciu o metodę Cloppera-Pearsona dla pojedynczej proporcji.

* Swoistość (ang. specificity) - opisuje zdolność wykrywania osób rzeczywiście zdrowych (bez danej cechy). Jeśli więc badamy grupę osób zdrowych, to swoistość daje nam informacje jaki procent z nich ma negatywny wynik testu.

\begin{displaymath}
\textrm{swoistość}=\frac{TN}{FP+TN}
\end{displaymath}

Przedział ufności budowany jest w oparciu o metodę Cloppera-Pearsona dla pojedynczej proporcji.

  • Wartości predykcyjne dodatnie i ujemne oraz współczynnik chorobowości
  • Wartość predykcyjna dodatnia (ang. positive predictive value - $PPV$) - prawdopodobieństwo, że osobnik miał chorobę mając pozytywny wynik testu. Jeśli więc badana osoba otrzymała pozytywny wynik testu, to PPV daje jej informację na ile może być pewna, że cierpi na daną chorobę.

\begin{displaymath}
PPV=\frac{TP}{TP+FP}
\end{displaymath}

Przedział ufności budowany jest w oparciu o metodę Cloppera-Pearsona dla pojedynczej proporcji.

  • Wartość predykcyjna ujemna (ang. negative predictive value - $NPV$) - prawdopodobieństwo, że osobnik nie miał choroby mając negatywny wynik testu. Jeśli więc badana osoba otrzymała negatywny wynik testu, to NPV daje jej informację na ile może być pewna, że nie cierpi na daną chorobę.

\begin{displaymath}
NPV=\frac{TN}{FN+TN}
\end{displaymath}

Przedział ufności budowany jest w oparciu o metodę Cloppera-Pearsona dla pojedynczej proporcji. Wartości predykcyjne dodatnie i ujemne są zależne od rozpowszechnienia choroby (od współczynnika chorobowości).

  • Współczynnik chorobowości (ang. prevalence) - prawdopodobieństwo wystąpienia choroby w populacji, dla której przeprowadzony był test diagnostyczny.

\begin{displaymath}
\textrm{Współczynnik chorobowości}=\frac{TP+FN}{n}
\end{displaymath}

Przedział ufności budowany jest w oparciu o metodę Cloppera-Pearsona dla pojedynczej proporcji.

  • Iloraz wiarygodności wyniku dodatniego i iloraz wiarygodności wyniku ujemnego
  • WypunktowanieIloraz wiarygodności wyniku dodatniego (ang. likelihood ratio of positive test - $LR_+$) - miara ta pozwala na porównywanie dopasowania wyników kilku testów do tzw. gold-standard i nie jest zależna od rozpowszechnienia choroby. Jest to iloraz dwóch szans: szansy na to, że pozytywny wynik testu otrzyma osoba z grupy chorych do szansy, że ten sam efekt będzie obserwowany wśród osób zdrowych.

\begin{displaymath}
LR_+=\frac{\textrm{czułość}}{1-\textrm{swoistość}}=\frac{TP\left(TP+FN\right)}{FP\left(FP+TN\right)}
\end{displaymath}

Przedział ufności dla $LR_+$ buduje się w oparciu o błąd standardowy:

\begin{displaymath}
SE=\sqrt{\frac{1-\textrm{czułość}}{TP}+\frac{\textrm{swoistość}}{FP}}.
\end{displaymath}

  • WypunktowanieIloraz wiarygodności wyniku ujemnego (ang. likelihood ratio of negative test - $LR_-$) - jest to iloraz dwóch szans: szansy na to, że negatywny wynik testu otrzyma osoba z grupy chorych do szansy, że ten sam efekt będzie obserwowany wśród osób zdrowych.

\begin{displaymath}
LR_-=\frac{1-\textrm{czułość}}{\textrm{swoistość}}=\frac{FN\left(TP+FN\right)}{TN\left(FP+TN\right)}
\end{displaymath}

Przedział ufności dla $LR_-$ buduje się w oparciu o błąd standardowy:

\begin{displaymath}
SE=\sqrt{\frac{\textrm{czułość}}{FN}+\frac{1-\textrm{swoistość}}{TN}}.
\end{displaymath}

  • Dokładność
  • Dokładność (ang. Accuracy (Acc)) - prawdopodobieństwo prawidłowej diagnozy przy wykorzystaniu testu diagnostycznego. Jeśli więc badana osoba otrzymała pozytywny lub negatywny wynik testu, to $Acc$ daje jej informację o tym na ile może być pewna postawionej diagnozy.

\begin{displaymath}
Acc=\frac{TP+TN)}{n}
\end{displaymath}

Przedział ufności budowany jest w oparciu o metodę Cloppera-Pearsona dla pojedynczej proporcji.

Okno z ustawieniami opcji wiarygodności diagnostycznej wywołujemy poprzez menu StatystykaTesty diagnostyczneWiarygodność diagnostyczna

Przykład (plik mammografia.pqs)

Mammografia jest jednym z najpowszechniej stosowanych testów przesiewowych pozwalających na wykrycie raka piersi. Poniższe badanie zostało przeprowadza na grupie 250 tzw. „bezobjawowych” kobiet w wieku od 40 do 50 lat. Mammografia może wykryć ognisko raka mniejsze niż 5 mm, ale również pozwala stwierdzić zmiany, które nie są jeszcze guzkiem, a jedynie zmianą struktury tkanek. Poniżej przedstawiono przykładowy wynik badania mammograficznego.

\begin{tabular}{|c|c||c|c|c|}
\hline
\multicolumn{2}{|c||}{Liczności obserwowane}& \multicolumn{3}{|c|}{Rzeczywistość (badanie histopatologiczne)} \\\cline{3-5}
\multicolumn{2}{|c||}{ }&choroba \textbf{(+)}&brak choroby \textbf{($-$)}& \textbf{Suma}\\\hline \hline
\multirow{3}{*}{test diagnostyczny} & wynik pozytywny \textbf{(+)} & 9 & 10 & 19 \\\cline{2-5}
&wynik negatywny \textbf{($-$)}& 1 &230 & 231\\\cline{2-5}
&\textbf{Suma} & 10 & 240 & 250\\\hline
\end{tabular}

Wyznaczymy wartości pozwalające dokonać oceny przeprowadzonego testu diagnostycznego.

  • 90% kobiet chorych na raka piersi zostało poprawnie zdiagnozowanych, czyli uzyskało pozytywny wynik mammografii;
  • 95.83% kobiet zdrowych (nie chorujących na raka piersi) zostało poprawnie zdiagnozowanych, czyli uzyskało negatywny wynik mammografii;
  • 4 kobiety na 100 przebadanych cierpi z powodu raka piersi;
  • Kobieta uzyskująca pozytywny wynik mammografii może być w 47.3\% pewna, że ma raka piersi;
  • Kobieta uzyskująca negatywny wynik mammografii może być w 99.57% pewna, że nie ma raka piersi;
  • WypunktowanieSzansa na to, że pozytywny wynik mammografii otrzyma kobieta rzeczywiście chora na raka jest 21.60 razy większa niż szansa, że pozytywny wynik mammografii otrzyma kobieta rzeczywiście zdrowa (nie chorujących na raka piersi);
  • WypunktowanieSzansa na to, że negatywny wynik mammografii otrzyma kobieta rzeczywiście chora na raka stanowi 10.43% szansy na to, że negatywny wynik mammografii otrzyma kobieta rzeczywiście zdrowa (nie chorujących na raka piersi);
  • WypunktowanieKobieta poddająca się mammografii (bez względu na uzyskany wynik) może być pewna postawionej diagnozy w 96.50%.

Narzędzia witryny