Statystyka nie jest bardzo trudna. Ale jak każda dziedzina wiedzy wymaga, żeby się z nią zaprzyjaźnić i dobrze zrozumieć. I jak każda dziedzina wiedzy ma swoje pułapki, które bardziej doświadczone osoby widzą na pierwszy rzut oka, a początkujący łatwo mogą w nie wpaść. Dzisiaj przedstawiam kilka podpowiedzi, na co warto zwrócić uwagę podczas swojej przygody ze statystyką. Co trzeba zrobić, żeby nie wpaść w pułapki statystyczne?
Czytaj dalejCzułość a swoistość – dlaczego musimy się tym martwić?
Po przerwie wracam do tematu macierzy błędów oraz do czułości (TPR, ang. sensitivity) i swoistości (TNR, ang. specifity). Dlaczego czułość i swoistość są tak ważne? Dlaczego wciąż o tym piszę począwszy od tematu macierzy błędów, przez ROC, AUC i współczynnik Youdena? Dlaczego powtarzam, że zwiększając jedno, wpływamy na drugie i że szukanie punktu odcięcia – kiedy uznamy kogoś za chorego (albo badany obiekt za jabłko) to bardzo poważna decyzja? Już Wam mówię, dlaczego.
Czytaj dalejEfekt Hawthorne – badanie zachowań ludzkich bywa naprawdę trudne
Efekt Hawthorne – czytałam o tym albo słyszałam już kilka razy i zawsze myślałam, że to jest coś, co warto opisać czytelnikom statystycznego. A potem zapominałam. I tak już wielokrotnie. Ale ostatnio znowu w jednej z czytanych książek natrafiłam na te słowa i stwierdziłam, że to już najwyższy czas, żeby zabrać się za ten temat. Tak więc zaraz dowiecie się, kto i kiedy opisał efekt Hawthorne. Jakie problemy sprawia w statystyce. I opowiem Wam jeszcze, jak można wykorzystać ten efekt w codziennym życiu. Chociażby po to, żeby… schudnąć… Jesteście ciekawi? Mam nadzieję, że tak.
Czytaj dalejWspółczynnik Youdena, jak połączyć czułość i swoistość i znaleźć punkt odcięcia
Współczynnik Youdena (indeks Youdena), nazwany od swojego twórcy Williama J. Youdena, jest miarą jakości testu diagnostycznego. Jest obliczany jako suma czułości (True Positive Rate, TPR) i specyficzności (True Negative Rate, TNR) pomniejszona o 1. Współczynnik ten pomaga znaleźć punkt odcięcia pomiędzy obiektami pozytywnymi i negatywnymi. Maksymalizuje zdolność do jednoczesnego zminimalizowania błędów dla obu klas (pozytywnej i negatywnej).
Czytaj dalejAUC – Area under curve – czyli co kryje się pod krzywą?
AUC – Area under curve – to kolejny krok po tym, jak już narysowaliśmy sobie krzywą ROC. Już samo przetłumaczenie na polski podpowiada, czego powinniśmy szukać. Obszar pod krzywą podpowie nam, jaka jest całkowita zdolność klasyfikatora do rozróżnienia między klasami. Spróbujmy więc to wszystko sobie narysować i odkryć, co tak naprawdę kryje się pod krzywą…
Czytaj dalej