Sztucznie inteligentny wróżbita
Jak działają zautomatyzowane „gaduły” takie jak ChatGPT czy LLaMA? W jednym zdaniu, starają się na podstawie danych historycznych przewidzieć kolejne słowo w danym tekście. Czy podobnemu algorytmowi udałoby się przewidzieć kolejne wydarzenie w życiu człowieka, na podstawie jego historii? W końcu życie to ciąg zdarzeń, tak jak zdania to ciąg słów. Naukowcy postanowili to sprawdzić. Z jaką skutecznością udaje im się wróżyć z sieci neuronowej?
Zespół Duńskich naukowców Germans Savcisens, Tina Eliassi-Rad (Uniwersytet Wisconsin-Madison), Lars Kai Hansen, Laust Hvas Mortensen, Lau Lilleholt, Anna Rogers, Ingo Zettler, and Sune Lehmann (Politechnika i Uniwersytet w Kopenhadze) w artykule z 2023 roku postawili sobie za zadanie przewidzieć kilka zdarzeń z ludzkiego życia na podstawie życiorysu. Po pierwsze, było to prawdopodobieństwo śmierci w danym roku. Po drugie, mniej oczywiste, postanowili przewidywać osobowość, zestawiając ją z ankietami z Duńskich rejestrów.
Dania to kraj połączonymi rejestrami i spisami płynący. Raj dla zajmujących się naukami społecznymi. Badacze połączyli dane socjo-ekonomiczne z danymi o zdrowiu by stworzyć unikatową bazę danych. Udało im się zebrać i ułożyć chronologicznie informacje o 2 milionach ludzi, których życiorysy byli w stanie śledzić przez dekadę. Dane socjo-ekonomiczne zawierały takie informacje jak aktualny zawód, sektor pracy, wykształcenie, miasto zamieszkania, dochód. Dane o zdrowiu zawierały informacje takie jak historię przebytych chorób, przyjmowane leki, wyniki badań. Kluczowo przy każdej informacji notowali wiek osoby i czas zdarzenia. Podali przykład typu informacji znajdujących się w bazie danych: „W trzecim roku nauki w szkole z internatem, Hermiona uczęszczała na pięć fakultatywnych zajęć.”, lub „We wrześniu 2020, Francisko otrzymał 20 tysięcy koron za pracę jako ochroniarz w zamku w Elsinore.”.
Zebrane informacje w formie „słów” postanowili zebrać w „zdania” definiujące zdarzenia. Układ zdań odzwierciedlał ich chronologię. Dzięki takiemu przedstawieniu mogli w taki sam sposób w jaki język naturalny zanurza się w matematycznych przestrzeniach, lepiej zrozumiałych dla komputera, zanurzyć życia ludzi. Następnie mogli zastosować podobne architektury sieci neuronowych, które wykorzystuje się do przetwarzania tekstu. Swoją metodę nazwali „life2vec”, co można przetłumaczyć jako „życie jako wektor”.
Ich model zanurzania radził sobie najlepiej wśród dostępnych dla badaczy obecnie metod w problemie przewidywania daty śmierci i cech osobowości. Szczegółowa analiza ich wyników pokazuje, że sztuczna inteligencja w sposób intuicyjny dla człowieka pogrupowała typy zdarzeń. Innymi słowy, zdarzenia, które człowiek uznaje za podobne do siebie, przedstawione innymi jednak słowami, znalazły się blisko siebie w wektorowej przestrzeni życia. W dużych klastrach maszyna utworzyła takie grupy jak zawody, zamieszkanie, wydarzenia związane ze zdrowiem. Co ciekawsze, powstały mniejsze podgrupki takie jak np. diagnozy związane z kontuzjami, zawody techniczne, praca na stanowisku menadżera, zdarzenia związane z wczesnym etapem macierzyństwa.
Coraz większa dostępność danych pozwala na coraz kreatywniejsze stawianie pytań badawczych. Ważne jest dla przyszłości ludzkości, by naukowcy mieli dostęp do połączonych danych z różnych źródeł. Może za jakiś czas wróżbita będzie miał jako asystenta sztuczną inteligencję. Może za jakiś czas asystenta będzie miał też lekarz.