Duże Modele Językowe (LLM) w Okulistyce

Współfinansowane ze środków Ministerstwa Edukacji i Nauki na podstawie umowy nr. POPUL/SN/0475/2023/01 w ramach projektu pt.: Kampania edukacyjna „Sztuczna inteligencja w okulistyce”

Kategoria: Artykuły

Prof. dr hab. med. Andrzej Grzybowski
Kierownik Katedry Okulistyki, Uniwersytet Warmińsko-Mazurski, Olsztyn
Kierownik Instytutu Okulistycznych Badań Naukowych, Fundacja Okulistyka 21, Poznań

Rozpocznijmy od omówienia podstaw dużych modeli językowych (ang. Large Language Models, LLM), takich jak ChatGPT i innych narzędzi opartych na sztucznej inteligencji. Modele te, wykorzystujące technologię przetwarzania języka naturalnego (ang. Natural Language Processing, NLP), są obecnie szeroko stosowane w różnych dziedzinach, w tym w medycynie. Przełomowe osiągnięcia LLM, takie jak architektura transformatorów, umożliwiły znaczące postępy w zrozumieniu i generowaniu języka. Te modele są wykorzystywane w różnych zadaniach związanych z analizą tekstu, klasyfikacją, generowaniem dokumentów, a także interaktywną komunikacją z pacjentami i lekarzami.

Rozwój technologii NLP

Technologia przetwarzania języka naturalnego przeszła przez kilka kluczowych etapów. W początkowych latach polegano na modelach opartych na regułach, które miały ograniczone możliwości ze względu na złożoność języka. Z czasem pojawiły się statystyczne modele językowe, które próbowały przewidywać kolejne słowa w oparciu o poprzednie, jednak miały one swoje ograniczenia związane z kontekstem i wydajnością. Prawdziwy przełom przyniosło wprowadzenie architektury transformatorów, która umożliwiła lepsze zrozumienie kontekstu słów w zdaniach. Modele takie jak BERT i GPT stały się fundamentem współczesnych LLM.

Przełomowe osiągnięcia LLM w medycynie

W kontekście medycyny LLM, takie jak ChatGPT, wykazały zdolność do rozwiązywania złożonych problemów związanych z analizą dokumentów, automatycznym generowaniem notatek medycznych oraz interakcją z pacjentami. Modele te posiadają ogromny potencjał do usprawniania procesów medycznych, a ich zastosowanie w okulistyce staje się coraz bardziej widoczne. Na przykład, LLM mogą wspierać lekarzy w diagnostyce, analizie wyników badań obrazowych, a także w dostosowywaniu materiałów edukacyjnych do poziomu zrozumienia pacjentów.

Zastosowania dużych modeli językowych w okulistyce

Automatyzacja dokumentacji medycznej

Jednym z najbardziej obiecujących zastosowań LLM w okulistyce jest automatyzacja dokumentacji medycznej. Dokumentacja medyczna jest kluczowym, ale czasochłonnym elementem pracy lekarzy, szczególnie w specjalnościach takich jak okulistyka, gdzie liczba pacjentów może być znacznie większa niż w innych dziedzinach medycyny. Modele LLM mogą stać się wirtualnymi skrybami, automatycznie generując zapisy wizyt, streszczenia wypisów ze szpitala czy notatki pooperacyjne.

LLM mogą działać w tle, rejestrując rozmowy między lekarzem a pacjentem, a następnie generując zwięzłe i dokładne streszczenia. Automatyczne generowanie dokumentów medycznych pozwala lekarzom na skupienie się na bezpośredniej opiece nad pacjentem, zamiast poświęcać czas na wprowadzanie danych do systemów informatycznych. To także zmniejsza ryzyko błędów wynikających z ręcznego wprowadzania danych.

Triage pacjentów

Modele LLM mogą wspierać proces triage, czyli wstępnej oceny stanu pacjenta i skierowania go do odpowiedniego specjalisty lub na odpowiednie badania. W okulistyce, gdzie wiele chorób może mieć podobne objawy (np. zaczerwienienie oka), LLM mogą wspomóc lekarzy w szybkiej analizie objawów na podstawie danych wprowadzonych przez pacjenta lub personel medyczny. Modele takie jak GPT-4 potrafią skutecznie zidentyfikować kluczowe objawy i sugerować kolejne kroki diagnostyczne, co może przyspieszyć proces leczenia i zmniejszyć liczbę niepotrzebnych wizyt.

Wsparcie w edukacji pacjentów

LLM mogą także odgrywać ważną rolę w edukacji pacjentów, tworząc spersonalizowane materiały edukacyjne dostosowane do poziomu zrozumienia i potrzeb pacjenta. Dzięki analizie danych takich jak wiek, wykształcenie i poziom znajomości terminów medycznych, LLM mogą generować instrukcje i wyjaśnienia, które są bardziej zrozumiałe dla pacjentów. Przykładowo, pacjent z zaawansowaną jaskrą może otrzymać łatwe do zrozumienia wyjaśnienia dotyczące leczenia, a także wskazówki dotyczące dbania o wzrok i regularnych kontroli.

Analiza obrazów

Jednym z najbardziej zaawansowanych zastosowań LLM w okulistyce jest analiza obrazów, która jest kluczowa w diagnostyce wielu chorób oczu, takich jak retinopatia cukrzycowa, zwyrodnienie plamki związane z wiekiem czy jaskra. Modele te mogą być zintegrowane z systemami do analizy obrazów optycznej tomografii koherentnej (OCT) czy angiografii fluoresceinowej, co pozwala na szybką i dokładną diagnozę. Dzięki możliwościom analizy obrazów LLM mogą zidentyfikować zmiany w siatkówce, takie jak mikrotętniaki czy wysięki, które są trudne do wykrycia gołym okiem.

Rozpoznawanie i leczenie chorób oczu

LLM mają potencjał do wspierania lekarzy w diagnostyce chorób oczu, a także w tworzeniu spersonalizowanych planów leczenia. Przykładowo, w diagnostyce chorób takich jak retinopatia cukrzycowa, modele AI mogą analizować obrazy dna oka i identyfikować zmiany patologiczne, które sugerują wczesne stadium choroby. Dzięki temu pacjenci mogą otrzymać leczenie wcześniej, co może znacznie poprawić ich szanse na zatrzymanie postępu choroby.

Wykorzystanie multimodalnych modeli AI

Nowoczesne modele LLM stają się coraz bardziej multimodalne, co oznacza, że mogą integrować różne źródła danych, takie jak tekst, obraz czy wideo. W okulistyce oznacza to, że modele te mogą jednocześnie analizować dane z badań obrazowych, notatek medycznych oraz wywiadów z pacjentami, co daje pełniejszy obraz stanu zdrowia pacjenta. Na przykład, model może jednocześnie analizować wyniki angiografii fluoresceinowej oraz opisy objawów pacjenta, aby dokładniej określić przyczynę problemu i zaproponować odpowiednie leczenie.

Duże Modele Językowe (LLM) w Okulistyce

Ograniczenia i wyzwania związane z LLM w medycynie

Brak wyjaśnialności modeli

Jednym z głównych wyzwań związanych z zastosowaniem LLM w medycynie jest tzw. „czarna skrzynka” – lekarze i pacjenci często nie wiedzą, w jaki sposób model dochodzi do konkretnej diagnozy lub rekomendacji. LLM, mimo że potrafią analizować ogromne ilości danych, często nie są w stanie jasno wyjaśnić swojego procesu decyzyjnego. To może prowadzić do braku zaufania do tych technologii, szczególnie w przypadkach, gdy wyniki są sprzeczne z doświadczeniem lekarzy.

Ryzyko błędnych diagnoz

Chociaż LLM mogą wspierać diagnostykę, istnieje ryzyko, że model może popełnić błąd, szczególnie w przypadkach nietypowych lub rzadkich chorób. Modele te są trenowane na dużych zbiorach danych, które nie zawsze obejmują wszystkie możliwe scenariusze kliniczne, co może prowadzić do niepełnych lub błędnych rekomendacji. Z tego powodu LLM powinny być stosowane jako narzędzie wspomagające decyzje, a nie jako jedyne źródło diagnozy.

Wyzwania związane z integracją z systemami EHR

Integracja LLM z systemami elektronicznej dokumentacji medycznej (EHR) jest kluczowa dla ich skutecznego działania, ale może być trudna do zrealizowania. Systemy EHR są często zróżnicowane pod względem formatów danych i sposobów ich przechowywania, co utrudnia integrację z LLM. Ponadto, modele AI muszą przestrzegać ścisłych regulacji dotyczących ochrony danych pacjentów, takich jak RODO, co stanowi dodatkowe wyzwanie.

Problemy z dokładnością w wielojęzycznych kontekstach

LLM, takie jak ChatGPT, są zazwyczaj trenowane na tekstach w języku angielskim, co oznacza, że ich dokładność w innych językach może być niższa. W kontekście międzynarodowej medycyny, gdzie pacjenci mówią różnymi językami, może to stanowić istotny problem. Modele muszą być dostosowane do specyficznych wymagań językowych i kulturowych, aby móc skutecznie wspierać lekarzy i pacjentów na całym świecie.

Problemy etyczne i prawne

Zastosowanie LLM w medycynie wiąże się również z pewnymi kwestiami etycznymi i prawnymi. Na przykład, kto ponosi odpowiedzialność w przypadku, gdy model AI popełni błąd, prowadzący do niewłaściwej diagnozy lub leczenia? Jak zapewnić, że dane pacjentów są chronione i wykorzystywane w sposób odpowiedzialny? Te pytania są kluczowe, aby technologia AI mogła być stosowana bezpiecznie i zgodnie z obowiązującymi przepisami.

Przyszłość dużych modeli językowych w okulistyce

LLM mają ogromny potencjał do rewolucjonizowania wielu aspektów medycyny, w tym okulistyki. W miarę jak technologie te stają się coraz bardziej zaawansowane, możemy spodziewać się dalszej integracji z systemami opieki zdrowotnej, co może prowadzić do bardziej spersonalizowanej opieki nad pacjentem, szybszej diagnostyki oraz efektywniejszych procesów klinicznych.

Poprawa dokładności i wyjaśnialności

W przyszłości możemy spodziewać się większej dokładności modeli LLM oraz lepszej wyjaśnialności ich decyzji. Naukowcy pracują nad rozwijaniem narzędzi, które pozwolą na lepsze zrozumienie, w jaki sposób modele AI podejmują decyzje, co zwiększy zaufanie do tych technologii.

Rozwój multimodalnych modeli

Multimodalne modele, które mogą integrować dane tekstowe, obrazowe i dźwiękowe, staną się kluczowym elementem przyszłości AI w medycynie. Dzięki temu modele te będą mogły analizować bardziej złożone dane i dostarczać bardziej kompleksowych rekomendacji.

Współpraca AI z lekarzami

W przyszłości modele LLM będą coraz częściej wspierały lekarzy w podejmowaniu decyzji, ale nie zastąpią ich całkowicie. AI będzie narzędziem, które pomoże lekarzom analizować dane, tworzyć plany leczenia i komunikować się z pacjentami, ale ostateczna odpowiedzialność za decyzje medyczne pozostanie w rękach specjalistów.

Wnioski

Duże modele językowe, takie jak ChatGPT, mają ogromny potencjał do rewolucjonizowania praktyki medycznej, w tym okulistyki. Ich zastosowanie w automatyzacji dokumentacji medycznej, analizie obrazowej, diagnostyce i edukacji pacjentów może znacznie poprawić jakość opieki zdrowotnej. Jednakże, aby w pełni wykorzystać potencjał tych technologii, konieczne jest dalsze badanie i rozwijanie narzędzi, które będą bardziej precyzyjne, wyjaśnialne i bezpieczne dla pacjentów.

Opracowano na podstawie:

Zhao W.X., Zhou K., Li J., et al. A survey of large language models. Available at:
https://arxiv.org/abs/2303.18223. 2023.
Du R, Xie S, Fang Y, et al. Validation of Soft Labels in Developing Deep Learning
Algorithms for Detecting Lesions of Myopic Maculopathy from Optical Coherence
Tomographic Images. Asia-Pac J Ophthalmol (Phila, Pa). 2022;11(3):227–236.
Mufti´c F, Kaduni´c M, Muˇsinbegovi´c A, et al. Exploring medical breakthroughs: a
systematic review of ChatGPT applications in healthcare. Southeast Eur J Soft
Comput. 2023;12(1):13–41.
Kung TH, Cheatham M, Medenilla A, et al. Performance of ChatGPT on USMLE:
potential for AI-assisted medical education using large language models. PLoS Digit
Health. 2023;2, e0000198.
Nori H., King N., McKinney S.M., et al. Capabilities of gpt-4 on medical challenge
problems. arXiv preprint arXiv:230313375 2023.
Singhal K., Tu T., Gottweis J., et al. Towards expert-level medical question
answering with large language models. arXiv preprint arXiv:230509617 2023.
Yang LWY, Ng WY, Foo LL, et al. Deep learning-based natural language processing
in ophthalmology: applications, challenges and future directions. Curr Opin
Ophthalmol. 2021;32(5):397–405.
Chotcomwongse P, Ruamviboonsuk P, Grzybowski A. Utilizing Large Language Models in Ophthalmology: The Current Landscape and Challenges. Ophthalmol Ther. 2024 Oct;13(10):2543-2558.
Betzler BK, Chen H, Cheng CY, Lee CS, Ning G, Song SJ, Lee AY, Kawasaki R, van Wijngaarden P, Grzybowski A, He M, Li D, Ran Ran A, Ting DSW, Teo K, Ruamviboonsuk P, Sivaprasad S, Chaudhary V, Tadayoni R, Wang X, Cheung CY, Zheng Y, Wang YX, Tham YC, Wong TY. Large language models and their impact in ophthalmology. Lancet Digit Health. 2023 Dec;5(12):e917-e924.
Yang Z, Wang D, Zhou F, Song D, Zhang Y, Jiang J, Kong K, Liu X, Qiao Y, Chang RT, Han Y, Li F, Tham CC, Zhang X. Understanding natural language: Potential application of large language models to ophthalmology. Asia Pac J Ophthalmol (Phila). 2024 Jul-Aug;13(4):100085.