Otwarte modele sztucznej inteligencji dorównują zamkniętym systemom w diagnostyce medycznej
Sztuczna inteligencja znajduje coraz szersze zastosowanie w medycynie, umożliwiając lekarzom szybsze i dokładniejsze diagnozowanie przypadków klinicznych. Przez ostatnie lata to zamknięte systemy AI, czyli te opracowane przez prywatne firmy i niedostępne do modyfikacji przez użytkowników, były liderami w rozwiązywaniu skomplikowanych problemów diagnostycznych. Jednak najnowsze badania sugerują, że modele open-source zaczynają dorównywać im skutecznością, co może mieć ogromne znaczenie dla przyszłości diagnostyki i zarządzania danymi medycznymi.
Nowe badania pokazują przełom w otwartej sztucznej inteligencji
Niedawno opublikowane badanie, finansowane przez Narodowy Instytut Zdrowia (NIH) i przeprowadzone przez naukowców z Harvard Medical School we współpracy z lekarzami z Beth Israel Deaconess Medical Center oraz Brigham and Women’s Hospital, wskazuje na potencjał modeli open-source w diagnozowaniu skomplikowanych przypadków medycznych. Wyniki tej analizy, opublikowane 14 marca w czasopiśmie JAMA Health Forum, pokazują, że otwarty model AI o nazwie Llama 3.1 405B osiągnął wyniki porównywalne do GPT-4, jednego z wiodących zamkniętych modeli AI.
W ramach badania przeanalizowano 92 skomplikowane przypadki diagnostyczne zamieszczone w tygodniku The New England Journal of Medicine, porównując skuteczność obu systemów w trafnym rozpoznawaniu chorób. Okazało się, że Llama 3.1 405B dorównał GPT-4, co sugeruje, że otwarte modele AI mogą stanowić atrakcyjną alternatywę dla zamkniętych systemów tworzonych przez duże firmy technologiczne.
Zalety i ograniczenia otwartego oraz zamkniętego oprogramowania AI
Otwarte i zamknięte systemy AI różnią się pod wieloma względami. Jedną z kluczowych różnic jest sposób przetwarzania i przechowywania danych pacjentów. Modele open-source można uruchamiać na prywatnych serwerach szpitalnych, co pozwala uniknąć konieczności przesyłania wrażliwych informacji do zewnętrznych serwerów, jak ma to miejsce w przypadku zamkniętych systemów. To właśnie ten aspekt sprawia, że otwarte rozwiązania mogą być atrakcyjniejsze dla administratorów szpitali i specjalistów IT odpowiedzialnych za bezpieczeństwo danych.
Dodatkowym atutem modeli open-source jest ich elastyczność. Mogą być one dostosowywane i modyfikowane przez lekarzy i naukowców w celu lepszego dopasowania do ich konkretnych potrzeb klinicznych. W przypadku zamkniętych systemów użytkownicy są zmuszeni polegać na gotowych rozwiązaniach oferowanych przez dostawców takich jak OpenAI czy Google, co ogranicza możliwość modyfikacji oprogramowania.
Z drugiej strony, zamknięte modele są zazwyczaj łatwiejsze w integracji ze szpitalnymi systemami IT i oferują tradycyjne wsparcie techniczne. Administracja takich systemów jest często mniej skomplikowana niż w przypadku platform open-source, gdzie użytkownicy muszą samodzielnie dbać o implementację i utrzymanie narzędzia.
Wyniki porównania: otwarta sztuczna inteligencja w akcji
Modele AI, zarówno otwarte, jak i zamknięte, są trenowane na ogromnych zbiorach danych zawierających podręczniki medyczne, recenzowane artykuły naukowe, historie przypadków oraz dane pacjentów (w formie anonimowej). Na podstawie analizy tych informacji algorytmy uczą się rozpoznawania wzorców chorób i diagnozowania pacjentów.
W przeprowadzonym eksperymencie model Llama został poddany testowi, który wcześniej przeszedł GPT-4. Przeanalizował 70 trudnych przypadków klinicznych opisanych w New England Journal of Medicine, a dodatkowo naukowcy ocenili jego skuteczność na 22 kolejnych przypadkach, które opublikowano już po zakończeniu jego procesu uczenia. Chodziło o upewnienie się, że AI nie natrafiła na te przypadki wcześniej w trakcie swojego szkolenia.
Wyniki były imponujące. Llama zdiagnozował przypadki poprawnie w 70% analizowanych sytuacji, podczas gdy GPT-4 uzyskał wynik na poziomie 64%. Ponadto w 41% przypadków właściwa diagnoza pojawiła się jako pierwsza sugestia w modelu open-source, w porównaniu do 37% dla GPT-4. Co więcej, wśród 22 nowych przypadków, Llama poprawnie rozpoznał 73% diagnoz, co wskazuje na jeszcze lepszą skuteczność tego modelu w rozwiązywaniu świeżych przypadków medycznych.
Skuteczniejsza diagnostyka dzięki konkurencji
Każdego roku w Stanach Zjednoczonych około 795 tysięcy pacjentów umiera lub doznaje trwałych uszczerbków na zdrowiu wskutek błędów diagnostycznych. Te pomyłki nie tylko mają poważne konsekwencje dla zdrowia pacjentów, ale także generują ogromne koszty dla systemów opieki zdrowotnej. Nietrafna diagnoza może prowadzić do niepotrzebnych badań, nieskutecznego leczenia, a nawet poważnych komplikacji, które stają się trudniejsze i droższe do rozwiązania.
Eksperci zgodnie podkreślają, że odpowiednio wdrożone i właściwie nadzorowane narzędzia AI mogą wspomóc lekarzy w ich codziennej pracy, poprawiając zarówno precyzję, jak i szybkość diagnozy. Ostatecznym celem jest stworzenie systemów, które mogą działać jako zaufani asystenci medyczni, wspierając lekarzy w procesach decyzyjnych, ale bez zastępowania ludzkiego doświadczenia i intuicji.
Badania sugerują, że modele open-source mogą nie tylko dorównać zamkniętym systemom, ale także zaoferować większą kontrolę i bezpieczeństwo danych dla szpitali i placówek medycznych. Rozwój AI w medycynie wkracza w nową fazę, w której konkurencja pomiędzy modelami otwartymi i zamkniętymi może przynieść korzyści zarówno pacjentom, jak i samym lekarzom.