Mediana i kwantyle — poznaj podstawowe miary statystyczne!
Miary statystyczne to liczbowe wskaźniki, które pozwalają opisać dane, analizować je i wnioskować na ich temat. Miary statystyczne będą z pewnością przydatne do zbadania konkretnych zjawisk związanych między innymi z gospodarką, ekonomią czy finansami, a nawet zjawiskami atmosferycznymi!
Nie wiesz, jaka jest różnica między kwantylem a kwartylem i na czym polega rola mediany?
Jakie wyróżniamy miary statystyczne i do czego mogą nam one posłużyć — wyjaśniamy poniżej.
Oto kilka podstawowych miar statystycznych:
Średnia arytmetyczna — jest to suma wszystkich wartości w zbiorze danych podzielona przez liczbę tych wartości. Reprezentuje przeciętną wartość w zbiorze.
Mediana — to wartość, która dzieli uporządkowany zbiór danych na dwie równe części, gdzie połowa danych znajduje się poniżej mediany, a druga połowa powyżej.
Moda — to wartość lub wartości, które występują najczęściej w zbiorze danych. Może być więcej niż jedna moda, a zbiór danych może być bez mody.
Wariancja — mierzy, jak bardzo dane różnią się od średniej arytmetycznej. Wyższa wariancja oznacza większy rozrzut danych.
Odchylenie standardowe — jest to pierwiastek kwadratowy z wariancji i wskazuje, jak bardzo dane różnią się od średniej w jednostkach tej samej zmiennej.
Rozstęp — to różnica między największą a najmniejszą wartością w zbiorze danych. Jest to prosta miara zakresu danych.
Kwartyle — to trzy punkty podziału uporządkowanego zbioru danych na cztery części: kwartyl pierwszy (Q1), kwartyl drugi (Q2, czyli mediana) i kwartyl trzeci (Q3).
Percentyle — to punkty podziału danych na setki części, co pozwala na określenie, ile procent danych znajduje się poniżej określonej wartości.
Miary statystyczne — jaka jest ich funkcja?
Miary statystyczne pomagają w analizie i zrozumieniu charakterystyk zbioru danych oraz w podejmowaniu wniosków na ich podstawie.
Mediana — co to takiego?
Mediana to jedna z najczęściej używanych miar centralnych w dziedzinie statystyki. Jest nazywana także wartością środkową zbioru danych. Mediana polega na podziale wszystkich obserwacji na dwie równe co do ilości grupy (w teorii) - jedną zawierającą wyniki niższe niż mediana i drugą zawierającą wyniki wyższe niż mediana. Innymi słowy, wartość mediany wskazuje, że połowa naszych wyników znajduje się poniżej tej wartości, a druga połowa znajduje się powyżej tej wartości.
Mediana jest szczególnie przydatna, gdy dane zawierają wartości skrajne lub odstające, ponieważ nie jest wrażliwa na te skrajności. W przeciwieństwie do średniej arytmetycznej mediana nie uwzględnia wartości, tylko ich pozycję w uporządkowanym zbiorze, co sprawia, że jest bardziej odporna na ekstremalne wartości.
Właściwości mediany
-
Mediana jest synonimem drugiego kwartyla, te nazwy są zamienne. Zarówno drugi kwartyl, jak i mediana dzielą zbiór obserwacji na dwie równe części.
-
Mediana, obliczona na podstawie próby, jest estymatorem wartości oczekiwanej w populacji, który jest zgodny i nieobciążony (asymptotycznie) estymatorem wartości oczekiwanej w populacji.
-
Mediana jest odporna na przypadki odstające w naszej próbie.
-
Mediana wykorzystywana jest jako statystyka opisowa dla zmiennych, które mają charakter porządkowy, jej wartość określa średni poziom danej zmiennej (z racji, że dla zmiennych o takich charakterze średnia arytmetyczna nie występuje).
Miary położenia — kwantyle, kwartyle, percentyle
Miary położenia wskazują, wokół jakich wartości koncentrują się rozkłady badanych zmiennych. Dzielimy je na klasyczne i pozycyjne. Do miar klasycznych zaliczają się średnie, takie jak arytmetyczna, harmoniczna i geometryczna. Z kolei miary pozycyjne obejmują dominantę (czyli modalną, czyli najczęściej występującą wartość) oraz kwantyle.
Kwantyle czy kwartyle? Na czym polega różnica i gdzie w tym wszystkim jest mediana?
W ramach miar pozycyjnych kwantyle są szczególnie ważne. Kwantyle dzielą zbiór danych na określoną liczbę części, co pozwala na analizę ich rozkładu. Te miary pomagają w zrozumieniu, jak dane rozkładają się wokół określonych wartości i jakie są typowe położenia obserwacji w analizowanym zbiorze danych.
Kwantyle są to takie wartości cechy, które dzielą badaną zbiorowość na określone, części pod względem liczebności. Spośród kwantyli najczęściej używanymi miarami są kwartyle, wśród których wyróżniamy kwartyl pierwszy (dolny), kwartyl drugi (mediana) oraz kwartyl trzeci (górny). Każdy z kwartyli dzieli zbiorowość uporządkowaną niemalejąco pod względem liczebności na dwie części, przy czym:
-
Kwartyl pierwszy dzieli zbiorowość na dwie części w ten sposób, że 25% jednostek zbiorowości ma wartości zmiennej mniejsze lub równe kwartylowi pierwszemu, a 75% - równe lub większe od tego kwartyla.
-
Mediana dzieli zbiorowość na dwie części w ten sposób, że 50% jednostek ma wartości mniejsze lub równe medianie oraz 50% - równe lub większe od mediany.
-
Kwartyl trzeci dzieli zbiorowość na dwie części w ten sposób, że 75% jednostek ma wartości zmiennej mniejsze lub równe kwartylowi trzeciemu, a 25% - równe lub większe od kwartyla trzeciego.\
Miary statystyczne nie muszą być trudne!
Zrozumienie miar statystycznych niektórym może wydawać się na pierwszy rzut oka skomplikowane, jednak warto poświęcić chwilę na próbę przyswojenia sobie pojęć, które nie tylko są interesujące, ale mogą przydać się w wielu dziedzinach życia, niekiedy zupełnie niespodziewanie.