Skoro na uniwerystecie w Kaliforni przyjęto tylko 35% aplikujących kobiet i 44% mężczyzn, to czy mamy do czynienia z dyskryminacją płci pięknej? Jaka metoda leczenia kamicy nerkowej przynosi najlepsze rezultaty? Gdzie jest najmniejsze bezrobocie? Kto najlepiej zdaje egzaminy? I gdzie w tym wszystkim jest miejsce dla Edwarda Simpsona?
Ostatnio staram się pokazać różne pułapki statystyczne. Już wiecie, że nie należy ufać dowodom anegdotycznym i nawet jeśli piątka długowiecznych staruszków objada się marchewką, to wcale nie jest to recepta na długie życie. Pokazywałam też, że korelacja jest super, ale nie ma nic wspólnego ze związkiem przyczynowo-skutkowym i piraci niekoniecznie mają wpływ na globalne ocieplenie (wybaczcie mi to Pastafarianie, Latający Potwór Spaghetti musi znaleźć inne dowody dla swoich wyznawców). Dziś pora na kolejną ciekawostkę, która pokazuje, że wyciąganie wniosków to nie jest prosty temat.
Na początku mała zagadka. Jaś i Małgosia mają do zdania 5 egzaminów. Mogą je sobie dowolnie rozłożyć na dwa dni. Pierwszego dnia Jaś zdał 0% wszystkich wybranych w danym dniu egzaminów, a Małgosia 25%. Drugiego dnia Jaś zdał 75% wybranych egzaminów, a Małgosia zdała 100%.
pierwszy dzień | drugi dzień | |
Jaś | 0% | 75% |
Małgosia | 25% | 100% |
Kto z powyższej pary sumarycznie zdał więcej egzaminów?
Odpowiedź tylko na pierwszy rzut oka wydaje się oczywista. Skoro Małgosia w pierwszym i drugim dniu pokonała Jasia w zdawalności, to wydaje się, że to ona zwyciężyła w naszym konkursie. Czy uwierzycie więc, jeśli Wam powiem, że sumarycznie Jaś zdał 60% swoich egzaminów, a Małgosia tylko 40%?
pierwszy dzień | drugi dzień | sumarycznie | procentowo | |
Jaś | 0 z 1 | 3 z 4 | 3 z 5 | 60% |
Małgosia | 1 z 4 | 1 z 1 | 2 z 5 | 40% |
Ten nietypowy paradoks zauważył Karl Pearson (tak, ten sam, od korelacji) w 1899 roku, a także Udny Yule w 1903. Dokładnie wszystko opisał Edward Simpson w artykule opublikowanym w 1951 roku. I to jego nazwisko najczęściej kojarzy się z paradoksem, choć niekiedy nazywany jest on również efektem Yule-Simpsona.
Pomyślmy o innej sytuacji. Uczelnia przyjmuje studentów na dwa kierunki: polonistyka i matematyka. Na każdym kierunku, sprawiedliwie, dostaje się na studia dokładnie taki sam procent kandydatów obu płci. Ale… spójrzmy sumarycznie. Miało być sprawiedliwie, a tu się okazuje, że jednak mamy do czynienia z większym odsetkiem przyjętych mężczyzn. Wszystkie dane przedstawiam w tabelce:
polonistyka | |||
przyjęci | odrzuceni | procentowo przyjęci | |
mężczyźni | 200 | 200 | 50,00% |
kobiety | 100 | 100 | 50,00% |
matematyka | |||
przyjęci | odrzuceni | procentowo przyjęci | |
mężczyźni | 50 | 100 | 33,33% |
kobiety | 150 | 300 | 33,33% |
sumarycznie | |||
przyjęci | odrzuceni | procentowo przyjęci | |
mężczyźni | 250 | 300 | 45,45% |
kobiety | 250 | 400 | 38,46% |
Przyjmujemy na polonistykę po 50% kobiet i mężczyzn. Na matematykę 33% kandydatów obu płci. Sumarycznie okazuje się, że przyjęliśmy 45% chętnych mężczyzn i tylko 38% chętnych kobiet. To jak to jest z naszą uczelnią? Dyskryminuje kobiety czy nie?
Temat ten nie jest zupełnie fikcyjny. W 1973 roku Uniwersytet Kalifornijski w Berkley został oskarżony o dyskryminację kobiet. Analiza wykazała, że przyjęli na studia 44% starających się mężczyzn i tylko 35% kobiet. Temat został szczegółowo przeanalizowany i poszczególne wydziały zaprezenowały swoje własne dane. Nie widać tu już dyskryminacji kobiet, a wręcz można pokusić się o stwierdzenie, że na większości wydziałów przyjmowano mniej mężczyzn niż kobiet. Oto dane dla sześciu największych wydziałów:
Mężczyźni | Kobiety | |
Wydział 1 | 62% | 82% |
Wydział 2 | 63% | 68% |
Wydział 3 | 37% | 34% |
Wydział 4 | 33% | 35% |
Wydział 5 | 28% | 24% |
Wydział 6 | 6% | 7% |
Tak więc, drogie panie, czasem dyskryminacja jest tylko pozorna. Jak się pchacie na bardziej oblegane kierunki studiów, to takie są tego efekty.
Kolejna dziedzina, gdzie możemy mieć do czynienia z paradoksem Simpsona to medycyna. Tak, na lekarzy również czekają pułapki statystyczne, często zupełnie nieuświadomione. I klasyczny przykład podawany w wielu źródłach, czyli kamica nerkowa. Badano skuteczność dwóch metod: operacji chirurgicznych oraz przezskórnej nefrolitotypsji (żeby było jasne, nie wiem, na czym to drugie polega, mam nadzieję, że nazwę dobrze przepisałam). Poniższa tabela pokazuje skuteczność leczenia:
operacje chirurgiczne | PCNL | |
małe kamienie | 93% (81/87) | 87% (234/270) |
duże kamienie | 73% (192/263) | 69% (55/80) |
sumarycznie | 78% (273/350) | 83% (289/350) |
Na czym polega problem? Zarówno w przypadku małych jak i dużych kamieni, bardziej skuteczne okazują się operacje chirurgiczne. Jeśli natomiast spojrzymy całościowo, to więcej pacjentów cieszy się dobrym zdrowiem po zastosowaniu metody PCNL. Jak to możliwe? Wyjaśnienie jest bardzo proste. Zwykle metody chirurgiczne są stosowane u pacjentów z większymi (co zazwyczaj oznacza – trudniejszymi do wyleczenia) kamieniami. Przezskórna nefrolitotypsja jest używana w wtedy, kiedy kamienie są mniejsze i procentowy udział wyleczonych pacjentów jest zdecydowanie większy. Trudno więc porównywać obie metody biorąc pod uwagę zarówno „łatwiejszych” jak i „trudniejszych” pacjentów.
Paradoks Simpsona to trudny temat, który potrafi namieszać mocno w różnych analizach statystycznych. Warto mieć świadomość, że możemy być za jego pomocą na różne sposoby oszukiwani. Nigdy nie wiadomo, czy ktoś nie próbuje nami zmanipulować, pokazując tę część wyników, która jest dla niego korzystna. Pomyślmy o dwóch małych miejscowościach i bezrobociu. Podzieliliśmy mieszkańców na osoby w wieku poniżej i powyżej 50 roku życia. W miejscowości A mamy do czynienia z mniejszym bezrobociem zarówno wśród ludzi młodszych jak i starszych. Ale sumarycznie, niestety, okazuje się, że bezrobocie jest dwa razy wyższe niż w miejscowości B. Jeśli w obu miejscowościach rządzą dwie różne partie polityczne, to jestem przekonana, że każda z nich wykorzystywałaby inne dane, żeby przekonać swoich potencjalnych wyborców, że lepiej potrafi walczyć z bezrobociem. A jaka jest rzeczywistość – zajrzyjcie sami do tabelki:
miejscowość A | zatrudnieni | wszyscy | bezrobocie |
osoby w wieku powyżej 50 lat | 65 | 120 | 45.83% |
osoby w wieku poniżej 50 lat | 175 | 180 | 2.78% |
razem | 240 | 300 | 20.00% |
miejscowość B | zatrudnieni | wszyscy | bezrobocie |
osoby w wieku powyżej 50 lat | 20 | 40 | 50.00% |
osoby w wieku poniżej 50 lat | 250 | 260 | 3.85% |
razem | 270 | 300 | 10.00% |
W której miejscowości chętniej byście zamieszkali?
Paradoks Simpsona to temat, który potrafi zaskoczyć wiele osób. Warto zdawać sobie z niego sprawę i czasem poszukać drugiego dna tam, gdzie wszystko wydaje się proste i oczywiste.
Przy okazji wszystkich chętnych zapraszam na mojego Facebooka.
Droga Czytelniczko! Drogi Czytelniku!
Dziękuję, że przeczytałaś/przeczytałeś mój artykuł. Mam nadzieję, że spełnił Twoje oczekiwania. Jeśli chcesz się podzielić swoimi przemyśleniami, to napisz do mnie na adres [email protected] albo znajdź mnie na Facebooku.
Zapraszam Cię również do zapoznania się ze spisem treści (staram się go aktualizować, choć nie zawsze to wychodzi) – jeśli lubisz statystykę, to na pewno znajdziesz coś do poczytania.
A jeśli w ramach podziękowania za ten wpis zechcesz zaprosić mnie na przysłowiową “wirtualną kawę”, to będę niezwykle zobowiązana. Co prawda kawy raczej nie pijam, ale kubek dobrej herbaty – z prawdziwą przyjemnością. A ponieważ w każdy artykuł wsadzam mnóstwo serducha i swojego wysiłku, to tym bardziej poczuję się doceniona.
Pozdrawiam Cię serdecznie i życzę miłego dnia!
Krystyna Piątkowska