W poprzednich tygodniach opisywałam różne miary tendencji centralnej. Dziś chciałabym wrócić trochę bardziej do podstaw statystyki i wyjaśnić, co właściwie badamy w statystyce i w jaki sposób to określamy.
Populacja statystyczna to inaczej zbiorowość statystyczna, populacja generalna albo zbiorowość generalna. Jest to zbiór elementów, które podlegają badaniu statystycznemu. Mogą się w tym zbiorze znaleźć ludzie, przedmioty, fakty – wszystko co chcemy analizować… Każdy element populacji statystycznej to jednostka statystyczna.
Podajmy sobie kilka przykładów:
Jeśli populacją będą wszyscy Polacy, to każdy pojedynczy mieszkaniec Polski jest jednostką statystyczną.
Jeśli populacja to pracownicy mojej firmy, to każdy pracownik jest jednostką statystyczną.
Populacją statystyczną mogą też być książki na półce w moim pokoju i wtedy każda z książek jest jednostką statystyczną.
Cechy statystyczne
Populację badamy ze względu na jakąś cechę statystyczną. I tu najpierw kilka słów o cechach statystycznych i ich podziale. Można wyróżnić cechy statystyczne ilościowe oraz jakościowe. Ilościowe dzieli się na ciągłe, które łatwo można przedstawić w postaci ułamka (np. wzrost) oraz skokowe, które przyjmują określone wartości np. tylko całkowite (np. liczba dzieci). Do ilościowych często zalicza się również cechy porządkowe, które przyjmują wartości określone nieliczbowo, ale możliwe do uszeregowania (np. rozmiar ubrania od XS do XXL).
Oprócz tego mamy również cechy jakościowe, czyli np. kolor oczu, rasa psa albo krój ubrania. Jeśli w przypadku cech jakościowych mamy do czynienia tylko z dwoma wariantami (jak np. płeć), to nazywamy taką cechę dwudzielną (albo inaczej binarną, dychotomiczną). Jeśli natomiast wariantów jest wiele (np. kolor włosów), to badana cecha jest wielodzielna.
Warto zwrócić uwagę na fakt, że niekiedy cechy porządkowe są kwalifikowane do jakościowych albo wręcz tworzy się dla nich odrębną kategorię – wszystko zależy od przyjętej interpretacji.
Powyższy podział cech jest spotykany najczęściej w podręcznikach, ale nie jest on jedynym. Można się spotkać również z podziałem zaproponowanym przez Stanleya Smitha Stevensa. Według niego cechy ilościowe dzieli się na proporcjonalne i interwałowe, a cechy jakościowe na porządkowe i nominalne. Nie będę dzisiaj szczegółowo rozpisywać różnic między podziałami, ale jeśli tylko będzie potrzeba, to wrócimy kiedyś do tematu.
Cechy stałe i zmienne
Żeby ustalić, co będzie naszą badaną populacją, to musimy zwrócić uwagę na to, które cechy są stałe dla wszystkich jednostek (czyli tak naprawdę stanowią kryterium przynależności do danej populacji) oraz cechy zmienne (które będą stanowić podstawę naszego badania). Określając cechy stałe staramy się zwrócić uwagę na to co chcemy badać (kryterium rzeczowe), gdzie chcemy badać (kryterium przestrzenne – gdzie znajdują się badane jednostki) oraz kiedy ma mieć miejsce badanie (kryterium czasowe). Każda z tych informacji jest ważna, każda wymaga szczegółowego przemyślenia przed rozpoczęciem naszej analizy.
Cechy zmienne to te, które właśnie chcemy zbadać. Jeśli nasza populacja to książki (kryterium rzeczowe) znajdujące się na moim regale (kryterium przestrzenne) właśnie dzisiaj (kryterium czasowe), to możemy znaleźć wiele cech zmiennych i musimy zdecydować, które z nich naprawdę nas interesują. Przykładowe cechy zmienne to liczba stron (cecha ilościowa skokowa), czas potrzebny na przeczytanie książki (cecha ilościowa ciągła), kolor okładki (cecha jakościowa wielodzielna), rodzaj okładki (twarda czy miękka – cecha jakościowa dwudzielna). Cech zmiennych można znaleźć bardzo dużo, ale nie wszystkie trzeba spisywać i analizować. Analityk statystyczny musi na samym początku swojej pracy dokładnie sprecyzować nie tylko badaną populację, ale również cechy zmienne, które chce badać i interpretować.
Podział populacji statystycznych
Populacje statystyczne można dzielić ze względu na różne kryteria. Spoglądając z punktu widzenia liczebności, populacje dzielimy na skończenie i nieskończenie liczne. Jeśli bierzemy pod uwagę ich umiejscowienie w czasie, to mamy do czynienia z populacjami statycznymi (analizowanymi w jednym, konkretnie ustalonym momencie) oraz dynamicznymi (badanymi w jakimś przedziale czasu). Można również analizować populacje jednowymiarowe (czyli z punktu widzenia jednej cechy) oraz wielowymiarowe (gdy badamy wiele cech). Populacje można również podzielić na jednorodne i niejednorodne (jeśli chcemy analizować wagę owoców na straganach rynkowych i na jednym będą same jabłka, to będzie to populacja jednorodna, a jeśli będą jabłka, gruszki i śliwki, to będziemy mieć do czynienia z populacją niejednorodną).
Myślę, że warto też zdać sobie sprawę z tego, że niektóre populacje (szczególnie te nieskończenie liczne) to populacje hipotetyczne. Nie istnieją one w rzeczywistości, ale można spróbować je sobie wyobrazić i uogólnić. Takim przykładem jest np. lista nieskończenie wielu rzutów monetą.
Zastanówcie się, jakie populacje jesteście w stanie zauważyć w swoim otoczeniu. Które wydają się ciekawe do zbadania i przeanalizowania?
Droga Czytelniczko! Drogi Czytelniku!
Dziękuję, że przeczytałaś/przeczytałeś mój artykuł. Mam nadzieję, że spełnił Twoje oczekiwania. Jeśli chcesz się podzielić swoimi przemyśleniami, to napisz do mnie na adres [email protected] albo znajdź mnie na Facebooku.
Zapraszam Cię również do zapoznania się ze spisem treści (staram się go aktualizować, choć nie zawsze to wychodzi) – jeśli lubisz statystykę, to na pewno znajdziesz coś do poczytania.
A jeśli w ramach podziękowania za ten wpis zechcesz zaprosić mnie na przysłowiową “wirtualną kawę”, to będę niezwykle zobowiązana. Co prawda kawy raczej nie pijam, ale kubek dobrej herbaty – z prawdziwą przyjemnością. A ponieważ w każdy artykuł wsadzam mnóstwo serducha i swojego wysiłku, to tym bardziej poczuję się doceniona.
Pozdrawiam Cię serdecznie i życzę miłego dnia!
Krystyna Piątkowska