Jak sztuczna inteligencja przewiduje nasze kariery?
Paweł Struski
Czy sztuczna inteligencja potrafi przewidzieć naszą zawodową przyszłość? Zespół badaczy z Harvardu, Stanfordu i Columbii pokazuje, że tak. Dzięki analizie milionów CV powstał model, który potrafi zaskakująco trafnie odtworzyć ścieżki karier i pomóc ekonomistom lepiej zrozumieć rynek pracy.
Jednym z kluczowych wyzwań w ekonomii pracy jest próba przewidzenia, jak potoczy się zawodowa przyszłość konkretnej osoby. Takie prognozy pozwalają lepiej rozumieć zmiany strukturalne na rynku pracy, analizować kariery różnych grup społecznych czy oceniać skuteczność programów socjalnych. Aby jednak móc cokolwiek sensownie przewidywać, trzeba mieć dobre dane. Najlepiej jest, gdy badacze mogą obserwować te same osoby przez wiele lat.
Sztandarowym przykładem takiego projektu jest amerykańskie Panel Study of Income Dynamics (PSID) – badanie, które od 1968 r. nieprzerwanie śledzi losy tych samych rodzin i ich potomków. To prawdziwa perła nauk społecznych, ale też przedsięwzięcie kosztowne i logistycznie skomplikowane. Niewiele krajów może pozwolić sobie na podobną inicjatywę, a tam, gdzie się to udaje, liczba uczestników jest z konieczności ograniczona.
Z pomocą przychodzą jednak nowe techniki uczenia maszynowego i nowe źródła danych. Keyon Vafa z Uniwersytetu Harvarda wraz z zespołem badaczy ze Stanfordu i Columbii zaproponowali alternatywną metodę. Nawiązali współpracę z prywatną firmą Zippia, zajmującą się doradztwem zawodowym, i uzyskali dostęp do imponującego zbioru 24 milionów CV. Na tej podstawie odtworzyli przebieg karier zawodowych milionów osób, a następnie, korzystając z technik uczenia maszynowego, zbudowali model potrafiący przewidywać kolejne etapy kariery danej osoby. Dzięki dostępowi do tych danych, model nauczył się rozpoznawać schematy karier ludzi i generować ścieżki, które mają dobre odzwierciedlenie w rzeczywistości.
Model ten nazwali CAREER (z ang. kariera). Co ciekawe, oparto go na tej samej architekturze, z której korzystają współczesne modele językowe, takie jak ChatGPT (tzw. architektura Transformer). Różnica polega na tym, że zamiast generować słowa, CAREER „pisze” ciąg kolejnych etapów zawodowych na podstawie dotychczasowej ścieżki. Dzięki stosunkowo niewielkim rozmiarom może działać nawet na zwykłym komputerze poza wielkimi laboratoriami badawczymi. Oczywiście model ma też swoje mankamenty. Jednym z nich jest to, że może generować jedynie takie stanowiska, jakie pojawiły się w danych źródłowych. A ponieważ niektóre profesje stopniowo zanikają, a w ich miejsce pojawiają się nowe, prognozy modelu z czasem mogą tracić na aktualności.
W kolejnym kroku naukowcy postanowili połączyć CAREER z klasycznymi narzędziami ekonometrii. Okazało się, że kompaktowy sposób, w jaki model reprezentuje historię kariery, pozwala znacząco poprawić skuteczność tradycyjnych metod przewidywania zarobków. Dzięki temu łatwiej analizować m.in. wpływ przynależności do związków zawodowych, wykształcenia czy płci na poziom wynagrodzeń.
Przykład ten pokazuje coś ważnego: sztuczna inteligencja nie tylko automatyzuje świat, ale też otwiera nowe ścieżki poznania. W połączeniu z dużymi, niestandardowymi zbiorami danych staje się realnym narzędziem rozwoju nauki, nawet w tak „ludzkich” dziedzinach jak ekonomia pracy.
Referencje:
Vafa, K., Palikot, E., Du, T., Kanodia, A., Athey, S., & Blei, D. M. (2024). CAREER: A Foundation Model for Labor Sequence Data (No. arXiv:2202.08370). arXiv.
