Wpis
Praca z danymi w HR krok po kroku — pięć etapów analizy
Pięcioetapowy proces analizy danych personalnych — od pytania biznesowego po prezentację wniosków. Bez kroku 1 i 5 reszta jest martwa, a 80% pracy to czyszczenie danych.
Większość projektów analitycznych w HR nie zatrzymuje się na braku danych ani na braku narzędzi. Zatrzymuje się na źle postawionym pytaniu albo na nieumiejętności sprzedania wyniku zarządowi. Pięć etapów opisanych poniżej jest szkieletem, który porządkuje pracę z danymi tak, żeby wynikiem była decyzja, a nie tabela. Każdy etap jest niezbędny; pominięcie jakiegokolwiek z nich kosztuje albo powtórkę projektu, albo brak adopcji wniosków przez biznes.
Etap 1: pytanie biznesowe
Najtrudniejszy i najważniejszy. Bez konkretnego problemu, który chcemy rozwiązać, projekt analityczny będzie postrzegany jako strata czasu — niezależnie od jakości wykonania.
Trzy cechy dobrego pytania biznesowego:
- Wskazuje decyzję, którą wynik analizy zmieni. „Czy nasza polityka podwyżkowa premiuje top performerów?” wskazuje decyzję (zmiana algorytmu podwyżek). „Jakie mamy dane o wynagrodzeniach?” nie wskazuje żadnej.
- Ma jasno zdefiniowaną grupę docelową. Pracownicy aktywni czy też byli, pełen etat czy wszyscy, jedna lokalizacja czy organizacja, wszystkie role czy konkretna kategoria zaszeregowania.
- Ma określony horyzont czasowy. „Czy w 2025 roku rozkład podwyżek różnił się między kobietami a mężczyznami w tej samej kategorii zaszeregowania” jest pytaniem operacyjnym. „Jak płacimy kobietom” jest tematem do dyskusji, nie pytaniem do analizy.
W praktyce klienta etap 1 jest najczęściej rozmową, nie zadaniem analitycznym. Zarząd przychodzi z hasłem („nie dopłacamy ekspertów”); analityk przekształca je w testowalne pytanie (compa-ratio ekspertów vs. medianę pasma, dynamika wskaźnika rok do roku, korelacja z rotacją). Przeskoczenie tej rozmowy oznacza, że projekt zwróci jakąś liczbę, która nie odpowie na to, o co rzeczywiście pytano.
Jeśli po etapach 2–4 wynik nie prowadzi do decyzji, należy wrócić do etapu 1. Najczęstszą przyczyną martwych projektów jest to, że pytanie biznesowe było źle sformułowane, nie to, że analiza była zła.
Etap 2: dobór danych
Cztery decyzje na tym etapie:
- Źródła. Wewnętrzne (HRIS, payroll, system ocen, ATS), finansowe (system księgowy, budżet), rynkowe (raporty płacowe — Sedlak, Mercer, WTW; benchmarki branżowe od stowarzyszeń). Każde źródło ma własne opóźnienia i własne ograniczenia próby.
- Okres. Snapshot punktowy (stan na 31 grudnia) odpowiada na inne pytania niż dane okresowe (rok, kwartał). Snapshot pokazuje strukturę; dane okresowe — dynamikę.
- Porównywalność. Wszystkie wynagrodzenia w analizie muszą być w tych samych jednostkach: brutto, znormalizowane do pełnego etatu (FTE) — dwie zasady opisane w wprowadzeniu do analizy płac. Bez tej konwencji mediana i średnia są liczone na heterogenicznych populacjach.
- Granica próby. Czy do analizy wchodzą pracownicy na okresie próbnym, na urlopach długoterminowych, na umowach B2B. Każda z tych decyzji jest legalna; istotne, żeby była świadoma i zapisana, bo wpływa na interpretację wyniku.
Dwie typowe pomyłki etapu 2: dorzucenie danych „bo są” (rośnie próba kosztem porównywalności) oraz wycięcie podgrup, których analitycy „nie rozumieją” (pracownicy na 1/4 etatu, byli pracownicy, kontraktorzy B2B) — zwykle te właśnie podgrupy niosą najciekawszą informację o polityce wynagrodzeń.
Etap 3: czyszczenie danych
Według praktyków pracujących z danymi to ok. 80% pracy w analityce — niezależnie od tego, czy mówimy o HR, finansach czy marketingu. „Beznadziejne dane na wejściu oznaczają beznadziejną analizę na wyjściu” jest regułą, której nie da się obejść umiejętnościami statystycznymi.
W polskich danych płacowych powtarza się pięć typów problemów opisanych szerzej w notce o problemach z danymi HR:
- braki w polach (data zatrudnienia, kategoria zaszeregowania, płeć);
- dane nieaktualne lub niespójne (wynagrodzenie aktualizowane raz w jednym systemie, raz w drugim);
- literówki i błędy zapisu (przesunięty przecinek 5 100 zł vs. 51 000 zł);
- duplikaty (przy łączeniu danych z różnych źródeł);
- niepewne dane, których ani nie da się naprawić, ani zignorować bez utraty znaczącej części próby.
Dwa narzędzia diagnostyczne:
- Test mnożenia kolumny przez 1. W arkuszu kalkulacyjnym jeśli kolumna ma format tekstowy zamiast liczbowego (typowe po imporcie z CSV), mnożenie zwróci błąd dla każdej wartości tekstowej. Filtrowanie po błędach ujawnia rekordy do poprawy.
- Wykrywanie wartości skrajnych. Wartości odbiegające o więcej niż dwa odchylenia standardowe od mediany pasma — albo, prościej, wartości poniżej P5 i powyżej P95 — wymagają sprawdzenia. To zwykle albo błąd zapisu, albo realna obserwacja warta osobnego raportowania (np. ekspert z historycznym kontraktem, długoterminowo chory pracownik).
Czyszczenie kończy się decyzją: które obserwacje skrajne wchodzą do analizy, które są usuwane jako błędy, a które są raportowane osobno jako anomalie wymagające komentarza zarządczego. Decyzja musi być zapisana — to wpływa na interpretację wyniku w etapie 5.
Etap 4: analiza
Najprzyjemniejszy etap dla analityków, najczęściej rozdmuchany w narracjach o „analityce HR”. W rzeczywistości jeśli etapy 1–3 są zrobione porządnie, etap 4 sprowadza się do uruchomienia ustalonych miar na uporządkowanych danych.
Trzy poziomy analizy w polityce wynagrodzeń, opisane szerzej w trzech warstwach diagnostyki:
- Warstwa 1, spójność wewnętrzna — mediana, średnia, percentyle (Q1, Q3, D9) per kategoria zaszeregowania; compa-ratio per pracownik i per grupa.
- Warstwa 2, konkurencyjność rynkowa — porównanie mid-pointów organizacji do mediany rynku z raportu płacowego; compa-ratio rynkowe per pracownik; lista ról niedopłaconych względem rynku.
- Warstwa 3, strategia — synteza dwóch poprzednich w rekomendację siatki, polityki podwyżek, raportu zgodnościowego (dyrektywa o przejrzystości wynagrodzeń (UE 2023/970)).
Pułapka etapu 4: analizowanie do wyczerpania zasobów, bo „jeszcze jeden krzyżyk”. Kryterium zatrzymania jest etap 1 — gdy analiza odpowiedziała na pytanie biznesowe (potwierdziła, obaliła, wymusiła powrót do etapu 1), dalsze drążenie jest zbędne.
Etap 5: prezentacja wniosków
Drugą połową sukcesu jest prezentacja: jak doszliśmy do wniosków, jakie założenia przyjęliśmy w etapach 2–3, jakie ograniczenia ma analiza. Bez tego rekomendacje nie zostaną zaakceptowane przez zarząd — i to nie z powodu nieufności, tylko z powodu braku możliwości obrony decyzji wewnętrznie.
Trzy elementy, które zarząd potrzebuje w raporcie:
- Pytanie i odpowiedź. „Pytanie: czy w kategorii ekspertów płacimy poniżej rynku? Odpowiedź: tak, mediana ekspertów jest 12% poniżej P50 raportu Sedlak za 2025 rok.”
- Założenia i ograniczenia. Próba wykluczyła pracowników na okresie próbnym i na urlopach >6 miesięcy. Wynagrodzenia w raporcie Sedlak mają opóźnienie 8 miesięcy względem snapshotu. Compa-ratio liczone do P50 rynku, nie do P75.
- Co z tym zrobić. Rekomendacja podwyżki dla ekspertów o mediane 8% w cyklu marcowym; alternatywa retencyjna dla 12 osób z najwyższym ryzykiem rotacji.
Bez trzeciego punktu projekt jest opisem stanu, nie wkładem w decyzję. Konsekwencja: zarząd nie wie, co ma zrobić, i projekt umiera w szufladzie.
Co dalej
Pięć etapów nie jest sekwencją liniową — między etapem 4 a 1 zwykle wraca się przynajmniej raz. Brak rozwiązania w etapie 4 jest sygnałem, że pytanie z etapu 1 było źle postawione, a nie sygnałem, że trzeba więcej danych. Najczęstsza pomyłka w projektach analitycznych w HR to przeskoczenie etapu 1 i 5 — zaczynamy od „mamy SAP HR i snapshot wynagrodzeń” i kończymy na „stworzyliśmy 30 wykresów”. Między tym a decyzją zarządu jest cała przepaść.
- Trzy warstwy analityki comp&ben — gdzie etap 4 wpisuje się w pełną diagnostykę
- Najczęstsze problemy z danymi HR — co wykrywać i naprawiać w etapie 3
- Jak korzystać z raportów płacowych — etap 2 dla danych rynkowych
- Wprowadzenie do analizy płac — dwie zasady (brutto, FTE) obowiązujące na etapie 2
Jak legitnyhr to obsługuje
W projekcie strukturalnym legitnyhr automatyzuje etapy 3–5: dane wpada się raz (opisy stanowisk + scoring + snapshot wynagrodzeń), audyt loguje zmiany, eksport (PDF + xlsx) prezentuje wnioski z uzasadnieniami w formacie gotowym dla zarządu. Etap 1 (pytanie biznesowe) i etap 2 (dobór danych) leżą po stronie konsultanta — to świadoma granica, bo te etapy wymagają rozmowy z klientem, nie automatyzacji. Etap 3 jest częściowo wbudowany przez walidację Zod schemas i niemodyfikowalność snapshotów; rozszerzenie o automatyczne wykrywanie wartości skrajnych w danych klienta jest na roadmapie.
Zobacz: doradztwo ciągłe w polityce wynagrodzeń lub projekt struktury wynagrodzeń.