Sztuczna inteligencja okazała się skuteczniejsza od lekarzy w diagnozowaniu pacjentów na izbie przyjęć w przełomowym badaniu przeprowadzonym przez Harvard. Wyniki opublikowano w prestiżowym czasopiśmie „Science” i natychmiast wywołały gorącą dyskusję w środowisku medycznym.
Kluczowe fakty:
- W badaniu przeprowadzonym przez Harvard na 76 pacjentach AI (OpenAI o1) osiągnęła 67% trafności w diagnozowaniu na izbie przyjęć, podczas gdy lekarze tylko 50-55%.
- W planowaniu długoterminowego leczenia AI osiągnęła 89% skuteczności w porównaniu do zaledwie 34% wśród lekarzy korzystających z konwencjonalnych narzędzi.
- Około 20% lekarzy w USA już korzysta z AI wspomagającej diagnostykę, a w Wielkiej Brytanii 16% używa tych narzędzi codziennie.
AI kontra lekarze: twarde liczby
Eksperyment objął 76 pacjentów przyjętych na izbę przyjęć szpitala w Bostonie. Zarówno AI, jak i pary ludzkich lekarzy otrzymały te same dane: wyniki badań, informacje demograficzne i krótką notkę pielęgniarki o stanie pacjenta. Model AI (OpenAI o1) trafił z diagnozą dokładną lub bardzo zbliżoną w 67% przypadków. Lekarze? Tylko w 50-55%.
Różnica robi wrażenie, szczególnie że mówimy o warunkach, w których czas gra kluczową rolę.
Gdy dostępnych danych było więcej, skuteczność AI rosła do 82%, podczas gdy doświadczeni lekarze osiągali 70-79% trafności. Ta różnica nie była już jednak istotna statystycznie.
Badanie sprawdziło również AI w planowaniu długoterminowego leczenia: antybiotykoterapia, opieka paliatywna. Tu wyniki były jeszcze bardziej wymowne. AI i 46 lekarzy analizowało pięć przypadków klinicznych. Wynik? AI: 89% skuteczności. Lekarze korzystający z konwencjonalnych narzędzi (wyszukiwarek itp.): zaledwie 34%.
Przypadek, który mówi wiele
W jednym z opisanych przypadków pacjent trafił na izbę z zakrzepem w płucach i pogarszającym się stanem zdrowia. Ludzcy lekarze uznali, że leki przeciwzakrzepowe przestały działać. AI zwróciła uwagę na coś, co umknęło człowiekowi: w historii pacjenta widniało toczeń układowy, który mógł wywoływać zapalenie płuc. AI miała rację.
To jeden przypadek, ale bardzo wymowny.
Komentarz redaktora
Wyniki harwardzkiego badania są imponujące i trudno je zignorować. Jeśli AI potrafi w warunkach ostrego dyżuru, przy minimalnej ilości danych, diagnozować skuteczniej niż lekarz, to mówimy o potencjalnie ogromnym skoku jakości opieki medycznej, szczególnie tam, gdzie dostęp do specjalistów jest ograniczony. Ale warto zachować spokój i przeczytać badanie uważnie, nie tylko nagłówki.
Po pierwsze, AI analizowała wyłącznie dane tekstowe. Nie widziała pacjenta. Nie oceniła jego niepokoju, zasinienia warg, trudności z oddychaniem. Lekarz robi to w ciągu pierwszych sekund kontaktu. Po drugie, pojawia się niepokojące pytanie o odpowiedzialność: jeśli AI popełni błąd, kto ponosi konsekwencje? Szpital? Producent modelu? Lekarz, który zaufał algorytmowi? Na razie nikt nie ma gotowej odpowiedzi.
I wreszcie kwestia, którą poruszył dr Wei Xing z University of Sheffield: czy lekarze zaczną bezrefleksyjnie ufać AI, zamiast myśleć samodzielnie? To nie jest scenariusz science fiction, to bardzo realne ryzyko automatyzacji myślenia klinicznego. AI jako drugi głos w gabinecie to dobry pomysł. AI jako pierwszy i ostatni głos to już zupełnie inna historia.
Piotr Wolniewicz, Redaktor Naczelny AIPORT.pl
Nie koniec lekarzy, ale zmiana ich roli
Autorzy badania są zgodni: AI nie zastąpi lekarzy. Arjun Manrai, jeden z głównych autorów i szef laboratorium AI w Harvard Medical School, powiedział:
„I don’t think our findings mean that AI replaces doctors. I think it does mean that we’re witnessing a really profound change in technology that will reshape medicine.” / „Nie sądzę, żeby nasze wyniki oznaczały, że AI zastąpi lekarzy. Uważam jednak, że jesteśmy świadkami głębokiej zmiany technologicznej, która przekształci medycynę.”
Dr Adam Rodman, współautor badania i lekarz w Boston Beth Israel Deaconess Medical Center, mówi o nadchodzącym „triadycznym modelu opieki”: lekarz, pacjent i sztuczna inteligencja. Nie zastąpienie, a uzupełnienie.
Lekarze już sięgają po AI, ale mają obawy
Dane rynkowe są jasne: niemal co piąty lekarz w USA już korzysta z AI wspomagającej diagnostykę. W Wielkiej Brytanii 16% lekarzy używa tych narzędzi codziennie, kolejne 15% co tydzień, według niedawnego badania Royal College of Physicians.
Główne obawy brytyjskich lekarzy to:
- ryzyko błędów AI i kwestia odpowiedzialności prawnej,
- brak formalnych ram regulacyjnych dla zastosowań klinicznych,
- potencjalne uzależnienie od algorytmów kosztem samodzielnego myślenia.
Prof. Ewen Harrison z University of Edinburgh przyznaje, że badanie jest ważne i pokazuje, że systemy AI „no longer just passing medical exams or solving artificial test cases. They are starting to look like useful second-opinion tools for clinicians” / „nie zdają już tylko egzaminów medycznych ani nie rozwiązują sztucznych przypadków testowych. Zaczynają wyglądać jak użyteczne narzędzia do uzyskiwania drugiej opinii dla klinicystów.”
Duże pieniądze, otwarte pytania
W spółki AI działające w obszarze ochrony zdrowia płyną miliardy dolarów. To jasny sygnał, że branża wierzy w tę technologię. Ale Dr Rodman zaznacza coś ważnego: pacjenci nadal chcą, żeby to ludzie prowadzili ich przez najtrudniejsze decyzje życiowe.
Dr Wei Xing z University of Sheffield stawia też nierozwiązaną kwestię: badanie nie pokazuje, przy jakich pacjentach AI radziła sobie gorzej. Czy starsi pacjenci są trudniejsi do zdiagnozowania przez algorytm? Co z osobami, które nie mówią po angielsku?
„It does not demonstrate that AI is safe for routine clinical use, nor that the public should turn to freely available AI tools as a substitute for medical advice.” / „Badanie nie dowodzi, że AI jest bezpieczna w rutynowym zastosowaniu klinicznym, ani że społeczeństwo powinno sięgać po ogólnodostępne narzędzia AI zamiast po poradę lekarską.”
Przełom? Tak. Rewolucja gotowa do wdrożenia? Jeszcze nie.
