Sztuczna inteligencja (AI) jest coraz bardziej obecna w różnych dziedzinach życia, w tym w analizie danych i przetwarzaniu informacji. Badanie przeprowadzone przez naukowców z Georgetown University Center for Global Health Science and Security w USA rzuca nowe światło na możliwości i ograniczenia generatywnej sztucznej inteligencji (GAI) w obszarze identyfikacji oraz interpretacji polityk zdrowotnych na skalę globalną. Wyniki opublikowano na łamach prestiżowego czasopisma naukowego PLOS ONE.
Tło badania
Projekt Analizy i Mapowania Polityk dotyczących Nowych Chorób Zakaźnych (Analysis and Mapping of Policies for Emerging Infectious Diseases) został stworzony, aby systematycznie gromadzić, analizować i kategoryzować polityki zdrowotne we wszystkich państwach członkowskich ONZ. Do tej pory proces ten był prowadzony głównie przez ekspertów w danej dziedzinie, co wymagało znacznego nakładu pracy ludzkiej.
Wraz z rozwojem technologii AI pojawiły się jednak nowe narzędzia pozwalające na szybkie przeszukiwanie i analizowanie ogromnych ilości danych medycznych. Badacze postanowili sprawdzić, na ile generatywna sztuczna inteligencja może zastąpić lub wspomóc ekspertów w szczegółowej analizie polityk zdrowotnych, w tym polityk dotyczących szczepień ochronnych i procedur kwarantanny oraz izolacji.
Kluczowe obserwacje
Jednym z głównych wniosków badania jest to, że narzędzia AI znacznie zwiększają efektywność procesu zbierania danych. Dla polityki dotyczącej szczepień czas potrzebny na kompletowanie danych zmniejszył się aż o 88%, a ogólna wydajność wzrosła o 90%. Jednakże, mimo imponujących wyników w kwestii szybkości działania, pojawiły się poważne problemy z dokładnością i spójnością uzyskiwanych informacji.
Analiza polityk szczepień
W przypadku polityk szczepień, badacze analizowali, czy w poszczególnych krajach istnieją prawnie wymagane rutynowe szczepienia dzieci lub też nadzwyczajne uprawnienia do obowiązkowych szczepień w czasie kryzysu. W tej dziedzinie narzędzie AI osiągnęło zgodność z pracą eksperta na poziomie 78%. Po wykluczeniu krajów, dla których zarówno narzędzie AI, jak i ekspert nie mogły znaleźć uniwersalnych przepisów prawnych dotyczących szczepień, poziom zgodności spadł do 63%.
Znaczące różnice w dokładności wyników zaobserwowano pomiędzy regionami WHO (Światowej Organizacji Zdrowia). Najwyższą zgodność między ekspertem a sztuczną inteligencją odnotowano w regionach zachodniego Pacyfiku oraz Europy, natomiast najniższą w regionach Azji Południowo-Wschodniej i wschodniej części Morza Śródziemnego. Narzędzie AI generowało nieprawidłowe odpowiedzi dotyczące szczepień w ponad 50% krajów afrykańskich, azjatyckich i z regionu wschodniego Morza Śródziemnego.
W pięciu przypadkach AI zidentyfikowała polityki, które nie zostały dostrzeżone przez eksperta. Wskazuje to na pewien potencjał narzędzia w wyszukiwaniu nieoczywistych danych, ale jednocześnie podkreśla konieczność walidacji uzyskanych wyników.
Analiza polityk kwarantanny i izolacji
Podobne wyniki zaobserwowano w przypadku analizy procedur dotyczących kwarantanny i izolacji. AI była zgodna z ekspertem w 67% przypadków. Największą zgodność zaobserwowano w regionie zachodniego Pacyfiku, natomiast najniższą w Afryce i wschodniej części Morza Śródziemnego. Średnie wyniki zanotowano w Europie, Ameryce i Azji Południowo-Wschodniej.
Jednym z czynników wpływających na dokładność narzędzia była bariera językowa. W krajach, w których oficjalnym językiem jest angielski, AI osiągnęła zgodność z ekspertem na poziomie 81%. W krajach używających innych języków wynik ten spadał do 63%. Wyniki te wskazują, jak istotne jest uwzględnienie wielojęzyczności w rozwoju technologii AI.
Znaczenie badania
Mimo swoich ograniczeń generatywna sztuczna inteligencja może być cennym narzędziem wspierającym procesy kontroli jakości w analizie polityk zdrowotnych. Badanie podkreśla jednak, że technologia ta wymaga dalszego rozwoju, zwłaszcza w zakresie identyfikacji polityk w różnych językach i regionach świata oraz w kontekście interpretacji specyficznych dla danego kraju uwarunkowań.
Zdaniem naukowców narzędzia generatywnej AI nie powinny być na razie wykorzystywane jako główne narzędzie do analizy polityk zdrowotnych. Najlepszym podejściem będzie zastosowanie ich jako wsparcia, na przykład jako drugiego lub trzeciego recenzenta, co pozwoli na zwiększenie efektywności przy jednoczesnym zachowaniu wysokiej dokładności wyników.