Często mamy do czynienia ze średnią arytmetyczną, ale pod tym pojęciem kryje się kilka statystyk: średnia arytmetyczna, mediana. Którą kiedy stosować statystykę, zapraszam do lektury 🙂
Wyobraźmy sobie że są dwie firmy z tej samej branży i staramy się wybrać firmę która lepiej wynagradza pracowników.
Z każdej firmy znamy zarobki na wszystkich stanowiskach, zakładamy że obie firmy zatrudniają 6 pracowników.
Firma A
Lp | Stanowisko | Zarobki | |
1 | stanowisko1 | 4100zł | |
2 | stanowisko2 | 4200zł | |
3 | stanowisko3 | 4400zł | |
4 | stanowisko4 | 4300zł | |
5 | stanowisko5 | 4300zł | |
6 | stanowisko6 | 20000zł |
Firma B
Lp | Stanowisko | Zarobki | |
1 | stanowisko1 | 5000zł | |
2 | stanowisko2 | 5100zł | |
3 | stanowisko3 | 5500zł | |
4 | stanowisko4 | 5200zł | |
5 | stanowisko5 | 5200zł | |
6 | stanowisko6 | 13000zł |
Średnia arytmetyczna
Liczymy średnia zgodnie ze wzorem:
Firma A
Firma B
Po wyliczeniu średniej stwierdzamy że Firma A płaci więcej od Firmy B swoim pracownikom. I tu średnia arytmetyczna wprowadziła nas w błąd, bo jak widać w danych detalicznych (tabele) nie jest to prawdą. Dlaczego tak się stało? Średnia arytmetyczna jest wrażliwa na dane odstające, w naszym przypadku tą daną jest wartość przy stanowisku 6 (zarobki prezesa firmy) wielokrotnie wyższe od pozostałych stanowisk.
Jak poradzić sobie z taką sytuacja? Przed użyciem średniej arytmetycznej warto poznać rozkład danych za pomocą histogramu, a dlaczego bo średnią arytmetyczną warto stosować, gdy dane są względnie symetryczne (brak danych odstających).
Mediana
Na ratunek przychodzi nam mediana, która jest niewrażliwa na odstające wartości. Mediana znajduje się zawsze po środku danych. Jest to wartość środkowa.
Jak liczymy medianę?
Aby znaleźć medianę należy uporządkować dane w kolejności rosnącej, a następnie wybrać wartość, która znajduje się dokładnie po środku. Przy parzystej liczbie danych tak jak w naszym przypadku (6 wartości), mediana jest średnia arytmetyczna dwóch środkowych wartości (a więc suma podzielonej przez 2).
Firma A
Firma B
Teraz widać że Firma B wynagradza lepiej swoich pracowników od Firmy A.
W tym przypadku rozkład danych sprawia że mediana okazał się lepszą statystyką, ale nie należy traktować mediany jako lekarstwo na całe zło, bo są również takie zbiory danych w których i mediana sobie nie poradzi, ale o tym w kolejnym artykule.
Pingback: 10 najbardziej przydatnych funkcji - Kurs Arkuszy Google