Estymator – szacunek (do) parametru

Estymator to statystyka, zmienna losowa, która służy do szacowania wartości parametru rozkładu. Brzmi skomplikowanie? Nie martwcie się,  estymacją mogą zajmować się nawet dzieci z podstawówki. Serio! Pamiętacie może program „Szalone liczby”? To właśnie tam Dusia i January robili konkursy dla początkujących matematyków. Jedno z zadań, stawianych przed dziećmi, polegało na estymacji. Przedstawiciele różnych podstawówek szacowali liczbę orzechów w dużej misce, wysokość dużego psa, liczbę sztachetek w płocie, karty w piramidzie itp. Zawsze podana była jakaś próbka – liczba orzechów w szklance, wysokość mniejszego psa, liczba sztachetek we fragmencie płotu czy liczba kart w małej piramidce. Kto nie pamięta – warto spojrzeć na youtube i poszperać w archiwalnych odcinkach. A skoro dzieci radziły sobie z estymacją, to i my sobie poradzimy.

Estymacja zaczyna się wtedy, kiedy nie badamy już szczegółowo całej populacji, tylko zaczynamy analizować jej wycinek (próbę statystyczną). Ale pomimo badania tylko małego wycinka, chcielibyśmy móc wypowiadać się na temat całości (jak z gulaszem – próbując jedną łyżkę, chcę wiedzieć, czy dobrze doprawiłam wszystko w garnku). Wtedy właśnie najbardziej przydaje się estymator, który pomaga oszacować na podstawie pobranej próby losowej wartości parametrów rozkładu całej populacji.

Przykład świeczek

Załóżmy, że jestem producentem świeczek. Właśnie z mojej taśmy produkcyjnej zeszła partia 100 tysięcy świeczek o zapachu goździków i pomarańczy. Chciałabym sprawdzić, ile czasu średnio pali się jedna taka świeczka, żeby móc tę informację umieścić w ulotce reklamowej. No ale przecież nie spalę wszystkich świeczek, bo nie będę mieć już nic do sprzedaży (a Święta blisko, już niecałe trzy miesiące, trzeba mieć gotowy asortyment, świetną ulotkę i reklamę w telewizji). Do pomocy przychodzi mi estymator. Biorę losową próbę np. 100 świeczek. Sprawdzam, jak długo paliła się każda z nich i liczę średnią arytmetyczną. Czy da mi to informację, ile czasu pali się każda świeczka z całej mojej populacji stu tysięcy świeczek? Oczywiście, że nie. Ale będzie to informacja wystarczająco dokładna, żebym mogła się nią podzielić z moimi klientami.

Estymacja punktowa i przedziałowa

Mogę podać, że jedna świeczka pali się 5 godzin. Mogę też określić przedział czasu 4-6 godzin. W pierwszym przypadku mamy do czynienia z estymacją punktową. W drugim podajemy tzw. przedział ufności, jest to estymacja przedziałowa. Podając jedną konkretną wartość istnieje duża szansa, że popełnimy błąd. Używając estymacji przedziałowej zwiększamy szansę, że nieznany parametr będzie znajdować się we wskazanym przedziale.

Estymator zgodny

Zwiększając liczebność próby zbliżamy się do szacowanego parametru. Czyli jeśli populacja liczy 100 elementów, a my będziemy mieć próbę 5-elementową, to jest duża szansa, że trafimy na jakieś jednostki nietypowe i wyliczona średnia z próby nie będzie odzwierciedlać średniej z populacji. Jeśli próba będzie 20-elementowa, to różnice będą maleć. W przypadku 50-elementowej próby możemy się spodziewać jeszcze lepszego odwzorowania populacji przez próbę.

Estymator nieobciążony

Estymator nieobciążony to taki, że wartość oczekiwana rozkładu estymatora jest równa wartości szacowanego parametru. Nie ma znaczenia, ile elementów jest w próbie, z której korzystamy.

Estymator efektywny

Estymator efektywny (najefektywniejszy), to ten o najmniejszej wariancji. Czyli wartości liczone za pomocą tego estymatora są najbardziej skupione wokół rzeczywistej wartości poszukiwanego parametru.

Koszty estymacji

Za każdym razem kiedy robimy badanie statystyczne, wiąże się ono z jakimiś kosztami. Podstawowym kosztem zawsze i wszędzie jest oczywiście czas badacza. Jeśli zatrudnia on dodatkowych pracowników, to również oni muszą poświęcić swój czas, muszą mieć zapłacone odpowiednie wynagrodzenie. Oprócz tego komputer do obliczeń, różne urządzenia pomiarowe. Czasem trzeba je kupić, czasem wypożyczyć. No i podstawowe koszty w sytuacji, kiedy w celu stworzenia estymatora musimy zniszczyć badane jednostki. Kiedy chcemy dowiedzieć się, jak długo pali się świeczka, to chcąc nie chcąc musimy ją spalić. Im mniej świeczek użyjemy, tym mniejszy koszt. Za to im więcej świeczek wykorzystamy do estymacji, tym dokładniejszy wynik otrzymamy. Tutaj właśnie jest istotne, jak dobry estymator uda nam się stworzyć – zależy nam na takim, który przy najmniejszym koszcie będzie dawał najbardziej precyzyjne wyniki.

Estymata

Estymata to wartość estymatora dla konkretnej próby. Czyli np. wybieramy, że naszym estymatorem dla wartości średniej arytmetycznej z populacji będzie średnia arytmetyczna z próby. Jeśli wylosujemy już konkretną próbę, która będzie reprezentatywna dla naszej populacji i z tej próby obliczymy wartość średniej arytmetycznej to będzie to właśnie estymata.

 


O estymacji przedziałowej możecie również przeczytać na zaprzyjaźnionym blogu pogotowia statystycznego.


Zapraszam serdecznie na mojego fejsbuczka.


mapa myśli: estymator

mapa myśli: estymator


Droga Czytelniczko! Drogi Czytelniku!

Dziękuję, że przeczytałaś/przeczytałeś mój artykuł. Mam nadzieję, że spełnił Twoje oczekiwania. Jeśli chcesz się podzielić swoimi przemyśleniami, to napisz do mnie na adres [email protected] albo znajdź mnie na Facebooku.

Zapraszam Cię również do zapoznania się ze spisem treści (staram się go aktualizować, choć nie zawsze to wychodzi) – jeśli lubisz statystykę, to na pewno znajdziesz coś do poczytania.

A jeśli w ramach podziękowania za ten wpis zechcesz zaprosić mnie na przysłowiową “wirtualną kawę”, to będę niezwykle zobowiązana. Co prawda kawy raczej nie pijam, ale kubek dobrej herbaty – z prawdziwą przyjemnością. A ponieważ w każdy artykuł wsadzam mnóstwo serducha i swojego wysiłku, to tym bardziej poczuję się doceniona.

Postaw mi kawę na buycoffee.to

Pozdrawiam Cię serdecznie i życzę miłego dnia!

Krystyna Piątkowska