Słownik
Źródła danych personalnych — co czyta dział HR
Źródła danych personalnych to dane HR-owe (płace, rekrutacja, oceny, nieobecności) i biznesowe (CRM, finanse, sprzedaż). HRIS jest centrum, ale analitykę robi się z kilku źródeł.
Źródła danych personalnych to wszystkie zbiory liczb i opisów, z których dział HR i controlling personalny mogą korzystać przy analityce, raportowaniu i decyzjach kadrowych. Dzielą się na dwie szerokie kategorie. Dane HR-owe powstają wewnątrz funkcji personalnej — to wynagrodzenia, dane rekrutacyjne, oceny pracownicze, struktura stanowisk, sukcesja, dane szkoleniowe, nieobecności, ankiety pracownicze, exit interview, podróże służbowe, inicjatywy wellbeingowe. Dane biznesowe powstają poza nią — CRM, system finansowo-księgowy, dane sprzedażowe, dane produkcyjne, KPI operacyjne. Dopiero połączenie dwóch warstw daje analitykę, która odpowiada na pytania zarządcze, a nie tylko opisuje stan kadr w próżni.
W polskich realiach większość firm operuje na podzbiorze tej listy — i to nie dlatego, że pozostałych danych nie ma, tylko dlatego, że nie zostały skatalogowane jako „dane do analityki”. Płace siedzą w module kadrowo-płacowym (np. Symfonia, Comarch, enova, Workday); dane rekrutacyjne — w ATS (eRecruiter, SmartRecruiters, Workable); oceny — w arkuszach Excela u HRBP; ankiety — w wynikach Officevibe / Culture Amp / Microsoft Forms. Punktem startowym uporządkowanej analityki jest spis tego, gdzie te dane fizycznie są — a nie zakup nowego systemu.
HRIS jako centrum, nie jedyne źródło
W dojrzalszych organizacjach centralnym źródłem danych HR-owych jest HRIS (ang. human resource information system) — zintegrowany system, który spina płace, kadry, strukturę stanowisk, czasem oceny i rekrutację. Systemy klasy Workday, SuccessFactors, BambooHR, polskie Symfonia HR czy enova HR pełnią tę funkcję w różnym stopniu. Im pełniejszy HRIS, tym mniej danych żyje w Excelach poza nim.
HRIS nie zastępuje jednak wszystkich źródeł. Dane jakościowe — exit interview, opinie z ankiet, mentoring, programy wellbeing — często powstają poza nim i wymagają osobnego procesu agregacji. To samo dotyczy danych biznesowych: HRIS nie zna marży klienta ani liczby zamówień obsłużonych przez zespół. Połączenie obu strumieni (np. „ile kosztował zespół, który obsłużył klienta X” albo „czy wynagrodzenia handlowców korelują z przychodem regionu”) wymaga albo hurtowni danych, albo regularnej pracy ręcznej z eksportami.
Co konkretnie wchodzi w grę
Praktyczna lista danych, które polski dział HR może mieć (rzadziej: ma w jednym miejscu):
- Wynagrodzenia — pensja zasadnicza, dodatki, premia regulaminowa i uznaniowa, total cash, narzuty pracodawcy, pole
fte, kategoria zaszeregowania, mid-point widełek; - Rekrutacja — liczba aplikacji, time-to-hire, koszt rekrutacji per stanowisko, źródła kandydatów, conversion rate per etap;
- Demografia — płeć, wiek, staż w firmie, staż w roli, lokalizacja, typ umowy;
- Performance — oceny okresowe, ranking, MBO/OKR, wskaźniki indywidualne (sprzedażowe, jakościowe, projektowe);
- Szkolenia (L&D) — godziny szkoleń per pracownik, budżet, ścieżki rozwoju, certyfikaty;
- Struktura stanowisk — opis stanowiska (JD), drzewo organizacyjne, span of control, mapowanie do ESCO/KZiS (Klasyfikacja Zawodów i Specjalności);
- Sukcesja i talenty — listy następców, talent pool, wyniki ocen 9-box, programy rozwojowe;
- Nieobecności i rotacja — urlopy, L4, rotacja dobrowolna i wymuszona, czas pracy;
- Exit interview i ankiety — powody odejść, eNPS, wyniki badań zaangażowania;
- Mentoring, podróże służbowe, well-being — często rozproszone, rzadko mierzone systematycznie.
W warstwie biznesowej najczęściej przydatne dla HR są: CRM (przypisanie klienta do osoby/zespołu), finanse (P&L per dział, marża per produkt, budżet per centrum kosztów), sprzedaż (przychody per zespół, liczba transakcji per handlowiec) i produkcja (wydajność na zmianę, jakość per linia, liczba reklamacji per zespół). To te dane pozwalają zadać pytanie „czy nasz system motywacyjny rzeczywiście wspiera wynik” — bez nich pomiar siły powiązania premii z rezultatem nie jest możliwy.
Co z RODO i Kodeksem pracy
Każde źródło danych personalnych jest jednocześnie zbiorem, który podlega ochronie. Najważniejsze ramy:
- Art. 22¹ Kodeksu pracy — zamknięty katalog danych, których pracodawca może żądać od kandydata i pracownika (imię, nazwisko, data urodzenia, wykształcenie, kwalifikacje, przebieg zatrudnienia oraz, dla pracownika, dodatkowo PESEL, adres, dane do celów ubezpieczeniowych i ZUS). Ustawa z 4 czerwca 2025 r. (Dz.U. 2025 poz. 807) zmieniła go istotnie — pracodawca nie może już pytać kandydata o historię wynagrodzeń.
- Art. 6 RODO — podstawa prawna przetwarzania danych zwykłych (najczęściej: niezbędność do wykonania umowy, obowiązek prawny pracodawcy lub uzasadniony interes administratora dla danych analitycznych w HR). Zgoda jako podstawa prawna w relacji pracodawca–pracownik bywa kwestionowana, bo nie jest dobrowolna w klasycznym rozumieniu.
- Art. 9 RODO — dane szczególnej kategorii (dane o zdrowiu, przynależności związkowej, pochodzeniu, orientacji). Dla HR praktycznie dotyczy danych o niepełnosprawności i L4 — tu wymagana jest osobna podstawa prawna (najczęściej Art. 9 ust. 2 lit. b RODO — obowiązki z zakresu prawa pracy).
- Ustawa o ochronie danych osobowych — krajowe doprecyzowanie zasad RODO, w tym specyficzne reguły dla zatrudnienia.
Dla analityki to oznacza dwie praktyczne reguły. Po pierwsze, dane indywidualne agreguje się tak szybko, jak to możliwe — analityka nie potrzebuje imienia i nazwiska, potrzebuje rozkładu w grupie. Po drugie, dane szczególnej kategorii trzymane są w osobnym zbiorze z zawężonym dostępem; nie wpadają do tej samej bazy, którą czyta szeroki zespół analityczny.
Najczęstsze problemy z dostępnością
Po stronie technicznej praca z tymi źródłami napotyka kilka regularnych przeszkód:
- Dane są, ale nie w jednym miejscu. Płace w Comarchu, ATS w Workable, oceny w Excelu HRBP, ankiety w Forms — agregacja wymaga albo eksportu i ręcznego zszywania, albo dedykowanej hurtowni;
- Identyfikatory się nie zgadzają. Ten sam pracownik w ATS jest „kandydatem #4527”, w Comarchu „pracownikiem 891”, w Excelu HRBP „Janek Kowalski”. Bez stałego klucza (PESEL, numer kadrowy, e-mail służbowy) cross-source łączenie jest pracą detektywistyczną;
- Definicje pól nie są wspólne. „Premia” w module płacowym może oznaczać premię regulaminową, a w raporcie sprzedaży — prowizję; w exporcie ATS „status: zatrudniony” może obejmować osoby na okresie próbnym, w module kadrowym — nie. Ujednolicenie słownika jest pierwszym, niewdzięcznym krokiem każdej analityki;
- Granulacja czasowa różni się. Płace miesięczne, oceny roczne, ankiety pulsowe co kwartał, exit interview ad hoc. Dopasowanie tego do jednego widoku wymaga decyzji o poziomie agregacji.
Te problemy są pod-tematem problemów z danymi HR i pracy z danymi krok po kroku — rozwijam je tam szczegółowo.
Powiązane terminy
- Analityka w comp&ben — trzy warstwy diagnostyki płac, każda korzysta z innego podzbioru źródeł
- Liczba błędów w rachubie płac — wskaźnik jakości danych płacowych
- Raporty płacowe — zewnętrzne źródło rynkowe, uzupełniające dane wewnętrzne
- Wynagradzanie — wprowadzenie — szerszy kontekst comp&ben
Jak legitnyhr to obsługuje
Operujemy świadomie na podzbiorze tej listy: struktura stanowisk (JD + scoring metodyką Hay/IPE/Mercer) i wynagrodzenia (snapshot do diagnostyki compa-ratio, luki płacowej, ocen efektywności). Pozostałe dane — rekrutacja, performance, L&D, nieobecności, talenty — leżą po stronie HRIS klienta, i tak ma być. Nie jesteśmy HRIS-em; jesteśmy warstwą diagnostyczną nad jego eksportem. Naturalna integracja, którą widzimy z klientami, to import struktury stanowisk z ich HRIS i mapowanie na ramy zewnętrzne (Hay/IPE/ESCO/Mercer). Im czystsze są dane wejściowe, tym ostrzejsza jest diagnostyka po stronie wynagrodzeń.
Zobacz: projekt struktury wynagrodzeń lub doradztwo ciągłe w polityce wynagrodzeń.