Statystyka

Cała prawda o średniej – średnia arytmetyczna

22 Sie , 2017  

Często mamy do czynienia ze średnią arytmetyczną, ale pod tym pojęciem kryje się kilka statystyk: średnia arytmetyczna,  mediana. Którą kiedy stosować statystykę, zapraszam do lektury 🙂

Wyobraźmy sobie że są dwie firmy z tej samej branży i staramy się wybrać firmę która lepiej wynagradza pracowników.

Z każdej firmy znamy zarobki na wszystkich stanowiskach, zakładamy że obie firmy zatrudniają 6 pracowników.

Firma A

Lp Stanowisko Zarobki
1 stanowisko1 4100zł
2 stanowisko2 4200zł
3 stanowisko3 4400zł
4 stanowisko4 4300zł
5 stanowisko5 4300zł
6 stanowisko6 20000zł

Firma B

Lp Stanowisko Zarobki
1 stanowisko1 5000zł
2 stanowisko2 5100zł
3 stanowisko3 5500zł
4 stanowisko4 5200zł
5 stanowisko5 5200zł
6 stanowisko6 13000zł

Średnia arytmetyczna

Liczymy średnia zgodnie ze wzorem:

    \[ \mu=\frac{\Sigma x}{n} \]

    \[ \mu=\frac{suma ~zarobk\'ow}{liczba ~pracownik\'ow} \]

 

Firma A

    \[ \mu=\frac{41300}{6}=6883 ~z\l{} \]

Firma B

    \[ \mu=\frac{39000}{6}=6500 ~z\l{} \]

Po wyliczeniu średniej stwierdzamy że Firma A płaci więcej od Firmy B swoim pracownikom. I tu średnia arytmetyczna wprowadziła nas w błąd, bo jak widać w danych detalicznych (tabele) nie jest to prawdą. Dlaczego tak się stało? Średnia arytmetyczna jest wrażliwa na dane odstające, w naszym przypadku tą daną jest wartość przy stanowisku 6 (zarobki prezesa firmy) wielokrotnie wyższe od pozostałych stanowisk.

Jak poradzić sobie z taką sytuacja? Przed użyciem średniej arytmetycznej warto poznać rozkład danych za pomocą histogramu, a dlaczego bo średnią arytmetyczną warto stosować, gdy dane są względnie symetryczne (brak danych odstających).

srednia arytmetyczna, mediana

Mediana

Na ratunek przychodzi nam mediana, która jest niewrażliwa na odstające wartości.  Mediana znajduje się zawsze po środku danych. Jest to wartość środkowa.

Jak liczymy medianę?

Aby znaleźć medianę należy uporządkować dane w kolejności rosnącej, a następnie wybrać wartość, która znajduje się dokładnie po środku. Przy parzystej liczbie danych tak jak w naszym przypadku (6 wartości), mediana jest średnia arytmetyczna dwóch środkowych wartości (a więc suma podzielonej przez 2).

Firma A

srednia arytmetyczna

Firma B

srednia arytmetyczna

Teraz widać że Firma B wynagradza lepiej swoich pracowników od Firmy A.

W tym przypadku rozkład danych sprawia że mediana okazał się lepszą statystyką, ale nie należy traktować mediany jako lekarstwo na całe zło, bo są również takie zbiory danych w których i mediana sobie nie poradzi, ale o tym w kolejnym artykule.

 

, , ,