W ostatnich latach sztuczna inteligencja (AI) zyskała na znaczeniu w różnych dziedzinach życia, w tym w opiece zdrowotnej. Szpitale coraz częściej korzystają z możliwości, jakie daje AI, aby poprawić jakość opieki nad pacjentami, a chatboty, takie jak Chat GPT, są jednym z narzędzi wspierających pracę lekarzy. Jednak najnowsze badania sugerują, że korzyści z korzystania z AI w diagnozowaniu chorób nie są jednoznaczne i wymagają dalszej analizy oraz szkoleń dla specjalistów medycznych.
Badanie: Czy Chat GPT poprawia dokładność diagnozy?
Zespół badawczy z UVA Health, kierowany przez dr. Andrew S. Parsonsa, przeprowadził eksperyment, w którym porównano skuteczność diagnozowania skomplikowanych przypadków medycznych przy użyciu Chat GPT Plus oraz tradycyjnych metod, takich jak źródła referencyjne (np. UpToDate©) i wyszukiwarki internetowe. W badaniu wzięło udział 50 lekarzy specjalizujących się w medycynie rodzinnej, wewnętrznej oraz medycynie ratunkowej. Połowa z nich korzystała z Chat GPT Plus, podczas gdy druga połowa używała standardowych narzędzi diagnostycznych.
Wyniki pokazały, że dokładność diagnozy w obu grupach była zbliżona. Lekarze korzystający z Chat GPT Plus osiągnęli średnią dokładność diagnostyczną na poziomie 76,3%, podczas gdy lekarze stosujący tradycyjne metody osiągnęli 73,7%. Różnica nie jest znacząca, co sugeruje, że sama obecność narzędzi AI nie gwarantuje lepszych wyników diagnostycznych.
Czy AI może zastąpić lekarzy?
Jednak interesującym wynikiem badania było to, że Chat GPT, działający samodzielnie, bez udziału lekarzy, osiągnął imponującą średnią dokładność diagnostyczną na poziomie ponad 92%. To sugeruje, że technologia taka jak Chat GPT ma potencjał do znacznej poprawy procesu diagnostycznego. Pomimo tego, badacze są zgodni, że AI nie powinna zastępować lekarzy, a raczej wspierać ich pracę.
— „Nasze badanie pokazuje, że AI sama w sobie może być skutecznym narzędziem diagnostycznym,” powiedział dr Parsons. „Zaskoczyło nas jednak, że dodanie lekarza do równania obniżyło dokładność diagnozy, choć zwiększyło efektywność. Wyniki te sugerują, że musimy przeprowadzić formalne szkolenia, aby nauczyć się, jak najlepiej korzystać z AI.”
Przyszłość AI w medycynie
W ramach badania lekarze pracowali z „klinicznymi winietami” – symulowanymi przypadkami opartymi na rzeczywistych danych pacjentów, w tym na ich historii medycznej, wynikach badań fizykalnych oraz wynikach testów laboratoryjnych. Wykazano, że lekarze korzystający z Chat GPT Plus byli nieco szybsi w diagnozowaniu, potrzebując średnio 519 sekund w porównaniu do 565 sekund w grupie korzystającej z tradycyjnych narzędzi.
Mimo imponujących wyników AI, badacze ostrzegają, że Chat GPT Plus w rzeczywistości może osiągnąć gorsze wyniki w realnych warunkach klinicznych. Istnieje wiele czynników, które wpływają na proces decyzyjny lekarza, takich jak prognozowanie długoterminowych skutków decyzji diagnostycznych i terapeutycznych. Dlatego konieczne są dalsze badania, które ocenią, jak AI może wspierać zarządzanie decyzjami medycznymi w prawdziwym świecie.
Współpraca człowieka z maszyną
Badanie podkreśla, że AI, chociaż ma ogromny potencjał, najlepiej działa jako narzędzie wspomagające. Kluczowe będzie przeszkolenie lekarzy w efektywnym korzystaniu z AI oraz w umiejętnym zadawaniu odpowiednich pytań (tzw. promptów). W przyszłości, organizacje medyczne mogą skorzystać z gotowych zestawów promptów, które mogą być wdrożone w procesie pracy klinicznej i dokumentacyjnej.
— „W miarę jak AI coraz bardziej integruje się z opieką zdrowotną, musimy zrozumieć, jak najlepiej wykorzystać te narzędzia, aby poprawić opiekę nad pacjentami oraz ułatwić pracę lekarzom,” dodał dr Parsons. „To badanie sugeruje, że jeszcze dużo pracy przed nami, zanim w pełni zoptymalizujemy naszą współpracę z AI w środowisku klinicznym.”
Publikacja wyników i dalsze badania
Wyniki badań zostały opublikowane w prestiżowym czasopiśmie naukowym JAMA Network Open. Badacze zapowiedzieli również kontynuację badań w zakresie zarządzania decyzjami medycznymi z użyciem AI. W tym celu powstała sieć badawcza ARiSE (AI Research and Science Evaluation), która ma na celu ocenę wyników generowanych przez AI w opiece zdrowotnej.
To badanie jest ważnym krokiem w kierunku zrozumienia, jak AI może wpłynąć na kształt przyszłej medycyny. Choć technologia ta ma ogromny potencjał, jej pełne wdrożenie wymaga jeszcze wielu badań i dostosowań, aby w pełni wspierała lekarzy w ich codziennej pracy, a co najważniejsze — poprawiała jakość opieki nad pacjentami.