Matematyka na słowach

Matematyka na słowach

Hubert Drążkowski

Co jeżeli powiem ci, że matematyka nie jest nauką o liczbach a o zależnościach między obiektami? Za pomocą statystyki opartej na logice rozmytej można z danych automatycznie generować zdania czytelne i łatwo interpretowalne przez końcowych użytkowników. Podsumowania lingwistyczne to narzędzie, które przybliża nas do konstruowania sztucznej inteligencji bardziej zbliżonej do tej przypominającej ludzką. Pozwala w precyzyjny sposób posługiwać się nieprecyzyjnymi pojęciami języka. Jak popularna jest ta metoda i gdzie można ją stosować?

Najczęściej cytowanym w historii artykułem z matematyki jest praca Loftiego Zadeha z 1965 roku „Zbiory rozmyte”. Naukowiec z Uniwersytetu Berkley przedstawił weń przełomowy pomysł, który zrewolucjonował logikę, tym samym otwierając dla naukowców wrota na nieprzebrane połacie tematów badawczych. Tradycyjna logika posługiwała się pojęciem fałszu i prawdy, surowych zer i jedynek. Logika rozmyta posługuje się natomiast pojęciem funkcji przynależności, czyli narzędziem, które wyżej wymienioną binarną dychotomię zamienia na cały przedział pomiędzy zerem a jedynką. Pomiędzy fałszem a prawdą znajduje się całe continuum stopni przynależności elementu do zbioru. Za pomocą tegoż aparatu można modelować dane nieprecyzyjne – pojęcia rozmyte. Niech za przykład posłuży nam temperatura (element) i przymiotniki ciepło oraz zimno (dwa zbiory). Oceniamy, że temperatura 18 C to element, który przynależy do określenia ciepło w stopniu 0,7, a do zimno w stopniu 0,1.

Generowanie podsumowań lingwistycznych oparte jest na wyżej opisanych zasadach. Podczas analizy otrzymujemy zdania, że „obiekt, który jest Q R jest P w pewnym stopniu prawdy”, np. „Wśród rezydentów po operacji serca większość (Q) nocy po wzmożonej aktywności fizycznej (R)  śpi długo (P).” – prawdziwe w stopni 0,7. Anna Wilbik, James Kelly oraz Gregory Alexander z Uniwersytetu w Missouri w artykule z 2011 roku pokazują jak generować tego typu czytelne dla pielęgniarek stwierdzenia na podstawie danych z zainstalowanych sensorów u seniorów w domach starców.

Polski zespół naukowców Katarzyna Kaczmarek Majer, Olgier Hryniewicz, Monika Dominiak, Łukasz święcicki w artykule z 2019 roku zastosowali podsumowania lingwistyczne aby automatycznie generować spersonalizowane informacje na temat pacjentów dotkniętych chorobą afektywną dwubiegunową. Na podstawie danych zbieranych z aplikacji mobilnej oraz spotkań chorych z psychiatrami udało im się tworzyć zdania typu „Większość z wykonywanych telefonów przez pacjenta A w stanie depresji jest długa”.

Choć wiele jeszcze pracy przed naukowcami to metoda generowania podsumowań lingwistycznych będzie stanowić kolejny etap automatyzacji procesu analizy danych. W czasie rzeczywistym użytkownik będzie mógł bez znajomości aparatu matematycznego, kryjącego się za algorytmem, przeczytać czytelne i zrozumiałe podsumowanie stanu pewnego procesu w języku naturalnym, języku używanych na co dzień rozmytych określeń.

 

GRAPE | Tłoczone z danych dla Dziennika Gazety Prawnej, 16 września 2022 r.

 

Tags: 
Tłoczone z danych