Słownik
Mediana vs średnia w analizie HR — kiedy która statystyka mówi prawdę
Mediana i średnia opisują tendencję centralną, ale na rozkładach skośnych — a takie są niemal wszystkie rozkłady płac — dają różne wyniki. Kiedy patrzeć na którą i co mówi rozjazd między nimi.
Mediana i średnia to dwie miary tendencji centralnej, których wyniki na tych samych danych potrafią się różnić o kilkanaście procent. W analizie HR — a szczególnie w analizie wynagrodzeń, gdzie rozkłady są niemal zawsze skośne w prawo (kilku ekspertów albo członków zarządu ciągnących górny ogon) — wybór statystyki przesądza o tym, czy raport opisuje sytuację typowego pracownika, czy fikcję wytworzoną przez kilka skrajnych obserwacji.
Definicja i wzór
Średnia arytmetyczna to suma obserwacji podzielona przez ich liczbę:
średnia = (suma wartości) / (liczba obserwacji)
Sensowna do liczenia od co najmniej trzech obserwacji. Wrażliwa na każdą wartość w zbiorze — jedna pensja odstająca o dwa rzędy wielkości przesuwa wynik diametralnie.
Mediana to wartość środkowa po uporządkowaniu danych rosnąco. Połowa obserwacji jest mniejsza, połowa większa. Przy parzystej liczbie obserwacji mediana jest średnią z dwóch wartości środkowych. Niewrażliwa na wartości skrajne — przesunięcie najwyższej obserwacji o dowolną kwotę nie zmienia mediany, dopóki nie zmienia rangi obserwacji w rosnącym uporządkowaniu.
W arkuszu kalkulacyjnym ŚREDNIA(zakres) i MEDIANA(zakres) w polskim Excelu, AVERAGE(range) i MEDIAN(range) w Google Sheets / angielskim Excelu — załatwiają obie statystyki.
Co mówi rozjazd między średnią a medianą
Zestawienie obu statystyk obok siebie jest narzędziem diagnostycznym samym w sobie. Trzy wzorce niosą informację:
- średnia >> mediana — w zbiorze są wartości skrajne w górę. W danych płacowych typowy obraz: kilku ekspertów albo dyrektor o wynagrodzeniu rzędu kilkukrotnie wyższym od reszty grupy. Średnia mówi „średnio zarabiamy 14 000 zł”, podczas gdy 8 z 9 osób zarabia 8–10 000 zł.
- średnia << mediana — wartości skrajne w dół. W HR najczęściej wynik błędu w normalizacji etatów (niewłaściwie przeliczone wynagrodzenie 1/4 etatu w zbiorze pełnoetatowych) albo kilka pensji minimalnych w grupie zdefiniowanej zbyt szeroko.
- średnia ≈ mediana — rozkład symetryczny albo wartości skrajne wzajemnie się znoszą. Statystycznie wygodny przypadek, w HR rzadki.
Reguła praktyczna: jeśli rozbieżność wynosi orientacyjnie kilka procent (zależnie od wielkości próby), nie ma czym się martwić. Rozjazd kilkunastoprocentowy jest sygnałem, że trzeba patrzeć na rozkład — sama mediana albo sama średnia w raporcie zarządczym ukrywa istotną informację o strukturze wynagrodzeń.
Kiedy patrzeć na medianę
Domyślny wybór w analizie wynagrodzeń. Trzy konkretne powody:
- Odporność na pojedyncze błędy danych. W 5-osobowej kategorii pracowników jedna źle zapisana pensja (przesunięty przecinek, błąd literowy) zniekształca średnią o kilkadziesiąt procent. Mediana nie rusza się wcale, jeśli błąd nie zmienia rangi obserwacji.
- Zgodność z raportami rynkowymi. Sedlak, Mercer, WTW, Korn Ferry raportują mediany jako P50. Porównywanie wewnętrznej średniej do mediany rynkowej byłoby porównywaniem dwóch różnych statystyk.
- Realizm w komunikacji. Komunikat „mediana w naszym zespole to 9 200 zł” mówi o typowym pracowniku. „Średnia 9 800 zł” mówi o środku ciężkości obejmującym też skrajny ogon — i przez to często wprowadza w błąd zarówno pracownika, jak i zarząd.
Kiedy potrzebna jest średnia
Średnia nie jest gorsza od mediany — jest inną statystyką, odpowiadającą na inne pytanie. Liczy się tam, gdzie znaczy ma łączna masa, nie typowa wartość:
- Budżet wynagrodzeń. Suma wynagrodzeń = średnia × liczba pracowników. Mediana nie ma takiej własności — nie da się policzyć budżetu jako mediana × N.
- Dyrektywa o przejrzystości wynagrodzeń (UE 2023/970), raport luki płacowej. Art. 9 wymaga raportowania i średnich, i median — osobno, równolegle, w ujęciu ogólnym i w podziale na kategorie pracowników. Sama mediana w raporcie GPG nie wystarcza; sama średnia również nie.
- Wskaźniki kosztowe na poziomie organizacji — średni koszt pracy, średnie wynagrodzenie pracownika dla porównań makro, średni koszt pracownika w modelach finansowych. Wszędzie tam średnia jest właściwą statystyką, a mediana mówiłaby nie to, co potrzeba.
Praktyka operacyjna w polskich danych HR
W polskich systemach kadrowo-płacowych (Symfonia, Comarch ERP Optima, enova365, SAP HR, Workday) snapshot wynagrodzeń przed analizą wymaga dwóch normalizacji opisanych w wprowadzeniu do analizy płac: wszystko w wartościach brutto i wszystko przeliczone na pełny etat (FTE). Bez tych konwencji mediana i średnia liczone są na heterogenicznych populacjach i dają wyniki nieinterpretowalne.
Zasada operacyjna: w raporcie zarządczym pokazywać medianę i średnią obok siebie. Jeśli rozjazd jest niewielki, raport jest czytelny. Jeśli jest istotny, rozjazd sam w sobie jest informacją — sygnał, że potrzebny jest pełniejszy obraz rozkładu (percentyle, kwartyle, decyle), a nie sucha liczba „przeciętnego wynagrodzenia”.
Czego unikać
- Średniej w komunikacji wewnętrznej do pracowników. Niemal zawsze jest fałszywym uspokojeniem („zarabiamy średnio X”), bo ogon wynagrodzeń kadry wyższej zawyża wynik. Mediana albo komunikat „połowa pracowników zarabia powyżej Y” niesie więcej informacji.
- Mediany w wyliczaniu budżetu lub kosztu pracy. Mediana nie sumuje się do całości — pomylenie tu kosztuje rozjazd między prognozą a rzeczywistym wykonaniem.
- Średniej na bardzo małych grupach (poniżej 5 osób). Statystyka traci wartość; mediana też zaczyna być chwiejna. Przy małych grupach sensowne są wartości graniczne (min, max), nie miary tendencji centralnej.
- Mylenia mediany z dominantą. Dominanta to wartość najczęstsza, mediana to wartość środkowa. Dla danych płacowych pseudociągłych (każda pensja prawie unikalna) dominanta jest często niemierzalna; mediana zawsze jest.
Powiązane terminy
- Mediana płac — formuła i rola w raportach komp&ben
- Średnia płac — formuła, pułapki i rola w raporcie GPG
- Percentyle, kwartyle, decyle wynagrodzeń — pełniejszy obraz rozkładu
- Dominanta, kwartyle, decyle, percentyle — pozostałe statystyki rozkładu
- Compa-ratio — wskaźnik bazujący na medianie pasma
- Luka płacowa — gdzie raportuje się obie statystyki równolegle
Jak legitnyhr to obsługuje
W diagnostyce wynagrodzeń i w raporcie luki płacowej pokazujemy medianę i średnią równolegle — żaden raport nie wychodzi z tylko jedną z tych statystyk. Compa-ratio liczone jest do mediany pasma (a nie do średniej), co jest świadomą decyzją metodologiczną zgodną z konwencją raportów Sedlak/Mercer i ze sposobem, w jaki dyrektywa o przejrzystości wynagrodzeń (Art. 9) wymaga raportowania medianowego w równolegle ze średnim. Rozjazd między medianą a średnią w wybranej grupie traktujemy diagnostycznie — jako sygnał, że trzeba patrzeć na pełniejszy rozkład, nie tylko na środek.
Zobacz: diagnostyka i raport luki płacowej lub projekt struktury wynagrodzeń.