legitnyhr

Słownik

Dominanta, kwartyle, decyle, percentyle — statystyki rozkładu w HR

Dominanta, kwartyle, decyle i percentyle opisują rozkład danych poza miarą tendencji centralnej. W analizie wynagrodzeń bez nich raporty rynkowe i polityka „celujemy w P50" nie mają sensu.

Autor: Błażej Mroziński

Dominanta, kwartyle, decyle i percentyle to statystyki opisujące rozkład danych — to, jak obserwacje rozkładają się od minimum do maksimum. Tendencja centralna (mediana, średnia) odpowiada na pytanie „gdzie jest środek?”. Statystyki rozkładu odpowiadają na pytanie „jak rozsiane są obserwacje wokół tego środka?”. W analizie wynagrodzeń to drugie pytanie jest często ważniejsze: dwie grupy o tej samej medianie mogą mieć zupełnie inną politykę płacową, jeśli mają inną szerokość rozkładu.

Cztery statystyki rozkładu

Dominanta (moda) — wartość najczęściej występująca w zbiorze. Liczona tylko wtedy, gdy istnieje pojedyncza wartość najczęstsza; jeśli wartości najczęstsze są dwie albo zbiór jest pseudociągły (każda obserwacja unikalna — typowe dla wynagrodzeń liczonych do grosza), dominanta jest niemierzalna albo bezużyteczna. Nie wymaga uporządkowania danych.

Kwartyle (Q1, Q2, Q3) — trzy progi dzielące uporządkowane obserwacje na cztery równe części po 25%. Q2 to inna nazwa mediany. Sensowne do liczenia od co najmniej 5 obserwacji.

Decyle (D1…D9) — dziewięć progów dzielących uporządkowane obserwacje na dziesięć części po 10%. D5 to mediana. Sensowne do liczenia od co najmniej kilkunastu obserwacji.

Percentyle / centyle (P1…P99) — 99 progów dzielących uporządkowane obserwacje na 100 części po 1%. P50 to mediana, P25=Q1, P75=Q3. Sensowne dopiero przy próbach kilkuset obserwacji — na małych próbach pojedynczy percentyl jest niestabilny i nieinterpretowalny.

Konwencja praktyczna: w raportach komp&ben dominują percentyle (P25, P50, P75, P90), bo ich nazwy są intuicyjne („P75 = próg, poniżej którego mieści się 75% rynku”). Kwartyle wracają w raportowaniu zgodnościowym dyrektywy o przejrzystości wynagrodzeń (UE 2023/970) — z istotnym przesunięciem terminologicznym opisanym niżej.

Wzajemne odpowiedniki — jedna oś, kilka nazw

Te same progi pojawiają się pod różnymi nazwami:

Średnia i dominanta są jedynymi z omawianych statystyk, które nie wymagają uporządkowania danych — można je policzyć w dowolnej kolejności obserwacji. Wszystkie pozostałe wymagają sortowania rosnąco.

Pułapka mediany jako jedynej statystyki

Klasyczny scenariusz w analizie wynagrodzeń. Dwie firmy raportują medianę 7 500 zł na tym samym stanowisku.

Firma A: Q1 = 7 200, Q3 = 7 800. Środkowe 50% pracowników mieści się w wąskim 600-złotowym przedziale. Polityka płacowa spójna, mało wewnętrznych konfliktów, kompresja płacowa jest realnym ryzykiem przy dłuższym stażu.

Firma B: Q1 = 5 500, Q3 = 9 500. To samo stanowisko, czterokrotnie szerszy rozrzut, mediana ta sama. Polityka albo świadoma (różne sub-role pod jednym tytułem), albo niespójna i rosnąca jako problem.

Mediana bez kontekstu rozkładu kłamie. Pierwszą poprawką jest patrzenie na rozstęp międzykwartylowy (Q3 − Q1) — ile punktów procentowych mediany zajmuje środkowe 50% obserwacji. Drugą poprawką jest dorzucenie skrajnych decyli (D1, D9) — pierwszych i ostatnich 10% rynku — które ujawniają obecność wartości skrajnych.

Dominanta w analizie wynagrodzeń

Dominanta jest statystyką niedocenianą i zarazem najtrudniejszą do liczenia w danych płacowych. W teorii pokazuje wartość najczęściej występującą w zbiorze; w praktyce wynagrodzenia są pseudociągłe (każda pensja prawie unikalna), więc surowa dominanta jest często niemierzalna.

Wyjątek: dane raportów rynkowych albo dane firmy z rygorystyczną siatką wynagrodzeń, gdzie wynagrodzenia grupują się wokół konkretnych poziomów (np. 4 200, 5 000, 6 000 zł). Wtedy dominanta dla danej kategorii potrafi pokazać, że „najwięcej pracowników zarabia dokładnie 4 200 zł” — informacja, której mediana nie niesie.

Diagnostycznie istotne: jeśli średnia jest wyraźnie wyższa od Q3 w tej samej grupie, sygnalizuje to obecność silnych wartości skrajnych w górnej części rozkładu. Sama mediana albo sama średnia nie ujawnia tego sygnału — dopiero zestawienie z Q3.

Konwencja Q1–Q4 w dyrektywie o przejrzystości wynagrodzeń

Ostrzeżenie terminologiczne wracające w raportowaniu zgodnościowym. W statystyce „kwartyle” oznaczają trzy progi (Q1, Q2, Q3) dzielące rozkład. W raportowaniu zgodnym z dyrektywą o przejrzystości wynagrodzeń „kwartyle” oznaczają cztery przedziały rozkładu (Q1 = dolna ćwiartka osób, Q4 = górna). Skrót Q1–Q4 znaczy więc co innego w kontekście statystycznym (próg) i raportowym (przedział wynagrodzeń, w którym znajduje się dana ćwiartka pracowników).

W raporcie GPG wymagana statystyka to udział kobiet i mężczyzn w Q1, Q2, Q3, Q4 — czyli koncentracja płci w czterech ćwiartkach wynagrodzeń organizacji. To inna informacja niż progi P25, P50, P75 — i wymaga osobnego liczenia. Komunikacja wewnętrzna powinna wyróżniać oba sensy słowa „kwartyl”, inaczej raport pisze się o czymś innym, niż oczekiwał klient.

Kiedy która statystyka jest przydatna

W arkuszu kalkulacyjnym KWARTYL.PRZEDZ.ZAMK(zakres; numer) w polskim Excelu, PERCENTYL.PRZEDZ.ZAMK(zakres; ułamek) dla percentyli — albo QUARTILE.INC / PERCENTILE.INC w wariantach angielskich. Wariant ekskluzywny daje inne wyniki na małych próbach i w analizach HR zwykle nie jest tym, czego potrzebujemy.

Czego unikać

Powiązane terminy

Jak legitnyhr to obsługuje

Pasma zaszeregowania w legitnyhr operują na kwartylach (lub tercylach w wybranych metodykach) — to świadoma decyzja zgodna z konwencją raportów Sedlak/Mercer. Compa-ratio porównuje wynagrodzenie do mediany pasma. Raport luki płacowej (Art. 9 dyrektywy o przejrzystości wynagrodzeń) raportuje udział kobiet i mężczyzn w czterech ćwiartkach wynagrodzeń organizacji — z jasnym wyróżnieniem, że Q1–Q4 oznaczają tu przedziały, nie progi statystyczne.

Zobacz: projekt struktury wynagrodzeń lub diagnostyka i raport luki płacowej.