Słownik
Dominanta, kwartyle, decyle, percentyle — statystyki rozkładu w HR
Dominanta, kwartyle, decyle i percentyle opisują rozkład danych poza miarą tendencji centralnej. W analizie wynagrodzeń bez nich raporty rynkowe i polityka „celujemy w P50" nie mają sensu.
Dominanta, kwartyle, decyle i percentyle to statystyki opisujące rozkład danych — to, jak obserwacje rozkładają się od minimum do maksimum. Tendencja centralna (mediana, średnia) odpowiada na pytanie „gdzie jest środek?”. Statystyki rozkładu odpowiadają na pytanie „jak rozsiane są obserwacje wokół tego środka?”. W analizie wynagrodzeń to drugie pytanie jest często ważniejsze: dwie grupy o tej samej medianie mogą mieć zupełnie inną politykę płacową, jeśli mają inną szerokość rozkładu.
Cztery statystyki rozkładu
Dominanta (moda) — wartość najczęściej występująca w zbiorze. Liczona tylko wtedy, gdy istnieje pojedyncza wartość najczęstsza; jeśli wartości najczęstsze są dwie albo zbiór jest pseudociągły (każda obserwacja unikalna — typowe dla wynagrodzeń liczonych do grosza), dominanta jest niemierzalna albo bezużyteczna. Nie wymaga uporządkowania danych.
Kwartyle (Q1, Q2, Q3) — trzy progi dzielące uporządkowane obserwacje na cztery równe części po 25%. Q2 to inna nazwa mediany. Sensowne do liczenia od co najmniej 5 obserwacji.
Decyle (D1…D9) — dziewięć progów dzielących uporządkowane obserwacje na dziesięć części po 10%. D5 to mediana. Sensowne do liczenia od co najmniej kilkunastu obserwacji.
Percentyle / centyle (P1…P99) — 99 progów dzielących uporządkowane obserwacje na 100 części po 1%. P50 to mediana, P25=Q1, P75=Q3. Sensowne dopiero przy próbach kilkuset obserwacji — na małych próbach pojedynczy percentyl jest niestabilny i nieinterpretowalny.
Konwencja praktyczna: w raportach komp&ben dominują percentyle (P25, P50, P75, P90), bo ich nazwy są intuicyjne („P75 = próg, poniżej którego mieści się 75% rynku”). Kwartyle wracają w raportowaniu zgodnościowym dyrektywy o przejrzystości wynagrodzeń (UE 2023/970) — z istotnym przesunięciem terminologicznym opisanym niżej.
Wzajemne odpowiedniki — jedna oś, kilka nazw
Te same progi pojawiają się pod różnymi nazwami:
- minimum, P10, P25=Q1, P50=Q2=D5=mediana, P75=Q3, P90=D9, maksimum.
Średnia i dominanta są jedynymi z omawianych statystyk, które nie wymagają uporządkowania danych — można je policzyć w dowolnej kolejności obserwacji. Wszystkie pozostałe wymagają sortowania rosnąco.
Pułapka mediany jako jedynej statystyki
Klasyczny scenariusz w analizie wynagrodzeń. Dwie firmy raportują medianę 7 500 zł na tym samym stanowisku.
Firma A: Q1 = 7 200, Q3 = 7 800. Środkowe 50% pracowników mieści się w wąskim 600-złotowym przedziale. Polityka płacowa spójna, mało wewnętrznych konfliktów, kompresja płacowa jest realnym ryzykiem przy dłuższym stażu.
Firma B: Q1 = 5 500, Q3 = 9 500. To samo stanowisko, czterokrotnie szerszy rozrzut, mediana ta sama. Polityka albo świadoma (różne sub-role pod jednym tytułem), albo niespójna i rosnąca jako problem.
Mediana bez kontekstu rozkładu kłamie. Pierwszą poprawką jest patrzenie na rozstęp międzykwartylowy (Q3 − Q1) — ile punktów procentowych mediany zajmuje środkowe 50% obserwacji. Drugą poprawką jest dorzucenie skrajnych decyli (D1, D9) — pierwszych i ostatnich 10% rynku — które ujawniają obecność wartości skrajnych.
Dominanta w analizie wynagrodzeń
Dominanta jest statystyką niedocenianą i zarazem najtrudniejszą do liczenia w danych płacowych. W teorii pokazuje wartość najczęściej występującą w zbiorze; w praktyce wynagrodzenia są pseudociągłe (każda pensja prawie unikalna), więc surowa dominanta jest często niemierzalna.
Wyjątek: dane raportów rynkowych albo dane firmy z rygorystyczną siatką wynagrodzeń, gdzie wynagrodzenia grupują się wokół konkretnych poziomów (np. 4 200, 5 000, 6 000 zł). Wtedy dominanta dla danej kategorii potrafi pokazać, że „najwięcej pracowników zarabia dokładnie 4 200 zł” — informacja, której mediana nie niesie.
Diagnostycznie istotne: jeśli średnia jest wyraźnie wyższa od Q3 w tej samej grupie, sygnalizuje to obecność silnych wartości skrajnych w górnej części rozkładu. Sama mediana albo sama średnia nie ujawnia tego sygnału — dopiero zestawienie z Q3.
Konwencja Q1–Q4 w dyrektywie o przejrzystości wynagrodzeń
Ostrzeżenie terminologiczne wracające w raportowaniu zgodnościowym. W statystyce „kwartyle” oznaczają trzy progi (Q1, Q2, Q3) dzielące rozkład. W raportowaniu zgodnym z dyrektywą o przejrzystości wynagrodzeń „kwartyle” oznaczają cztery przedziały rozkładu (Q1 = dolna ćwiartka osób, Q4 = górna). Skrót Q1–Q4 znaczy więc co innego w kontekście statystycznym (próg) i raportowym (przedział wynagrodzeń, w którym znajduje się dana ćwiartka pracowników).
W raporcie GPG wymagana statystyka to udział kobiet i mężczyzn w Q1, Q2, Q3, Q4 — czyli koncentracja płci w czterech ćwiartkach wynagrodzeń organizacji. To inna informacja niż progi P25, P50, P75 — i wymaga osobnego liczenia. Komunikacja wewnętrzna powinna wyróżniać oba sensy słowa „kwartyl”, inaczej raport pisze się o czymś innym, niż oczekiwał klient.
Kiedy która statystyka jest przydatna
- Dominanta — bardzo rzadko w danych ciągłych; zasadnicza w raportowaniu polityki widełek (gdzie mid-pointy są dyskretnymi poziomami) lub w raportach rynkowych zagregowanych do round-numberów.
- Kwartyle (progi Q1, Q3) — domyślne narzędzie diagnostyki rozstępu w średnich grupach (10–50 obserwacji). Rozstęp międzykwartylowy Q3 − Q1 jest najprostszą miarą szerokości rozkładu odporną na wartości skrajne.
- Decyle (D1, D9) — sensowne dla grup kilkudziesięciu obserwacji. D1 i D9 pokazują brzegi rozkładu — pracowników najgorzej i najlepiej opłacanych. W polityce „nagradzamy top 10%” decyl D9 jest progiem operacyjnym.
- Percentyle (P25, P50, P75, P90) — standardowy język raportów rynkowych. Polityka „celujemy w P50 dla większości ról, w P75 dla ról strategicznych” jest sformułowana w tym właśnie języku.
W arkuszu kalkulacyjnym KWARTYL.PRZEDZ.ZAMK(zakres; numer) w polskim Excelu, PERCENTYL.PRZEDZ.ZAMK(zakres; ułamek) dla percentyli — albo QUARTILE.INC / PERCENTILE.INC w wariantach angielskich. Wariant ekskluzywny daje inne wyniki na małych próbach i w analizach HR zwykle nie jest tym, czego potrzebujemy.
Czego unikać
- Liczenia percentyli na próbie kilkunastu obserwacji. P25 i P75 są wtedy chwiejne — pojedyncza obserwacja przesuwa próg o kilka procent. Decyl D5 = mediana to wszystko, co da się sensownie policzyć.
- Mylenia kwartyli statystycznych z ćwiartkami dyrektywy o przejrzystości wynagrodzeń. Pisma zgodnościowe muszą jasno wskazywać, czy mowa o progu (P25), czy o przedziale (Q1 = dolne 25% pracowników).
- Liczenia dominanty na danych pseudociągłych bez wcześniejszego zdyskretyzowania. Dla wynagrodzeń liczonych do grosza dominanta jest najczęściej bezużyteczna; zastępuje ją mediana z dodatkową informacją o skupieniu wokół określonych poziomów.
Powiązane terminy
- Percentyle, kwartyle, decyle wynagrodzeń — zastosowanie percentyli w raportach rynkowych
- Mediana płac — statystyka tendencji centralnej, najczęstsza referencja w komp&ben
- Mediana vs średnia — kiedy wybierać którą miarę środka
- Compa-ratio — wskaźnik bazujący na mid-pointcie pasma wynagrodzeń
- Mid-point — punkt referencyjny, zwykle ustawiany na medianie rynku (P50)
Jak legitnyhr to obsługuje
Pasma zaszeregowania w legitnyhr operują na kwartylach (lub tercylach w wybranych metodykach) — to świadoma decyzja zgodna z konwencją raportów Sedlak/Mercer. Compa-ratio porównuje wynagrodzenie do mediany pasma. Raport luki płacowej (Art. 9 dyrektywy o przejrzystości wynagrodzeń) raportuje udział kobiet i mężczyzn w czterech ćwiartkach wynagrodzeń organizacji — z jasnym wyróżnieniem, że Q1–Q4 oznaczają tu przedziały, nie progi statystyczne.
Zobacz: projekt struktury wynagrodzeń lub diagnostyka i raport luki płacowej.