Połowa dorosłych szuka informacji zdrowotnych w internecie. Jedna trzecia pyta już AI. A mimo to, kiedy pojawia się niepokojąca zmiana na skórze, większość ludzi nadal nie wie, co z tym zrobić. Badania Google Research opublikowane właśnie w prestiżowym piśmie JAMA Dermatology rzucają nowe światło na to, gdzie kończy się możliwość AI, a zaczyna problem z decyzjami klinicznymi.
Kluczowe fakty:
- Badanie Google Research opublikowane w JAMA Dermatology objęło 2345 uczestników podzielonych na trzy grupy: korzystających z wyszukiwarek tekstowych, prototypu AI opartego na analizie zdjęć oraz interfejsu z diagnozami przygotowanymi przez dermatologów.
- Uczestnicy korzystający z AI byli bardziej skłonni do próby nazwania schorzenia (ponad 62%) w porównaniu do grupy kontrolnej (41%), a dokładność w identyfikacji chorób była niemal trzy razy wyższa w grupie z AI (23%) niż bez wsparcia (8%).
- Badania Google Research sprawdzały nie tyle dokładność samego algorytmu AI, ile zdolność zwykłych użytkowników do efektywnego korzystania z takich narzędzi w kontekście decyzji dotyczących zdrowia skóry.
Zdjęcie zamiast słów
Dermatologia to jedna z tych dziedzin medycyny, w której obraz mówi więcej niż opis. Wyobraź sobie, że masz na nodze „czerwone plamki”. Wpisujesz to w Google i… dostajesz tysiące wyników, z których połowa sugeruje coś poważnego, a połowa mówi „to nic”. Problem polega na tym, że prawidłowe określenie tego objawu to „palpable purpura” i bez wiedzy medycznej nie masz szansy tego wyszukać.
Właśnie dlatego Google Research od kilku lat pracuje nad rozwiązaniami AI dla dermatologii. Budowali modele do diagnostyki różnicowej, publikowali zbiory danych jak SCIN, walidowali działanie algorytmów na zróżnicowanych populacjach. Teraz opublikowali wyniki dwóch badań, które sprawdzają coś innego: nie czy AI jest dokładna, ale czy zwykły człowiek potrafi z niej skorzystać.
Badanie na 2345 osobach
Eksperyment był dobrze zaprojektowany. Podzielono uczestników na trzy grupy. Pierwsza korzystała z normalnych narzędzi, czyli wyszukiwarek tekstowych. Druga miała dostęp do prototypu AI, który na podstawie zdjęcia i historii przypadku generował listę 3-7 możliwych schorzeń, razem z podręcznikowymi zdjęciami i opisami. Trzecia, tzw. „Wizard of Oz”, korzystała z tego samego interfejsu, ale zamiast rzeczywistego algorytmu AI wyświetlała diagnozy przygotowane przez dermatologów.
Wyniki w zakresie rozpoznawania były wyraźne. Uczestnicy korzystający z AI byli bardziej skłonni do próby nazwania schorzenia (ponad 62%) w porównaniu do grupy kontrolnej (41%). Co ważniejsze: dokładność w nazywaniu chorób była prawie trzy razy wyższa w grupie z AI (23%) niż w grupie bez wsparcia (8%). Grupa z „idealną AI” wyprzedzała wszystkich, osiągając 36%.
Brzmi świetnie. I jest świetnie. Ale jest też „ale”.
Gdzie AI się potyka
Rozpoznanie to nie to samo co decyzja. I tu zaczyna się problem.
Wyniki tego badania pokazują dokładnie to, co obserwuję w rozmowach o AI w medycynie od dłuższego czasu: AI jest coraz lepsza w rozpoznawaniu, ale nadal słaba w kontekście. Pacjent, który dzięki AI wie, że ma „łuszczycę”, niekoniecznie wie, czy powinien iść do lekarza jutro, czy za miesiąc. I to jest przepaść, której samo lepsze rozpoznawanie nie zasypie. Z drugiej strony, trzeba być uczciwy: skoro narzędzie potrafi trzykrotnie zwiększyć szansę na poprawne zidentyfikowanie schorzenia, to już jest ogromna wartość. Pytanie brzmi: co dalej z tą informacją? To jest pole do pracy dla projektantów systemów zdrowotnych, nie tylko inżynierów AI.
Piotr Wolniewicz, Redaktor Naczelny AIPORT.pl
Określenie odpowiednich kolejnych kroków medycznych, takich jak stosowanie domowych środków zaradczych kontra umówienie pilnej wizyty, pozostało trudne dla użytkowników. Liczby nie kłamią: w grupie AI uczestnicy nieznacznie częściej sugerowali mniej pilny krok niż dermatolog by zalecił, w porównaniu z grupą kontrolną (30% vs 27%).
Mówiąc wprost: AI sprawiła, że ludzie poczuli się pewniej. Ale ta pewność nie zawsze była uzasadniona.
To projektowe wyzwanie dla cyfrowej dermatologii: poprawa nie tylko rozpoznawania, ale też sposobu, w jaki przekazywane są informacje o leczeniu, pilności i dalszym postępowaniu.
Drugie badanie, prawdziwi pacjenci
Drugi projekt to już nie symulowane przypadki, lecz praca z prawdziwymi ludźmi. We współpracy ze Stanford i lokalnym planem opieki zdrowotnej z Kalifornii, 110 uczestników korzystało z aplikacji i konsultowało się z lekarzem bezpośrednio po sesji z AI.
Ciekawy szczegół: aplikacja była przetłumaczona na cztery języki, bo tak właśnie wyglądała obsługiwana społeczność. AI musi działać dla wszystkich, nie tylko dla anglojęzycznych użytkowników z szybkim internetem.
Klinicyści ocenili prognozy aplikacji jako zgodne z własnymi ocenami w 86% przypadków. Co więcej, gdy pacjenci otwierali aplikację podczas wizyty, lekarze mogli jej używać jako wspólnego punktu odniesienia w rozmowie z pacjentem. Aplikację jako przydatne narzędzie wskazało 92% lekarzy uczestniczących w badaniu.
To rzadki wynik: narzędzie przeznaczone dla pacjentów, które zyskało aprobatę lekarzy.
Polska perspektywa
Średni czas oczekiwania na pierwszą wizytę u dermatologa w Warszawie wynosi 156 dni. To nie jest wyjątek. Zgodnie z danymi Fundacji Watch Health Care z 2024 roku, na wizytę u lekarza specjalisty trzeba czekać przeciętnie ponad cztery miesiące. A w przypadku niektórych specjalizacji nawet rok.
Pięć miesięcy to długo, kiedy na plecach pojawia się coś, co może być łagodną wysypką, ale może też wymagać pilnej biopsji.
W takim kontekście narzędzia, które pomagają pacjentowi wstępnie ocenić sytuację i podjąć świadomą decyzję o pilności wizyty, mają konkretną wartość. Nie jako zastępstwo lekarza. Jako pomost między objawem a gabinetem.
Czym to narzędzie nie jest
Kilka rzeczy warto mieć w głowie, zanim zaczniemy mówić o rewolucji:
- To nie jest AI, która diagnozuje. To AI, która informuje i porządkuje dostępne informacje.
- Badanie dotyczyło prototypu, nie gotowego produktu dostępnego na rynku.
- Eksperyment opierał się na przypadkach retrospektywnych i zanonimizowanych, nie na analizie w czasie rzeczywistym.
- Nawet najnowsze badania z JAMA Dermatology potwierdzają: nowoczesne modele AI dorównują dokładnością klinicystom ze średnim doświadczeniem, ale nadal ustępują ekspertom z ponad dziesięcioletnim stażem.
Badania Google Research są rzetelne i ostrożne w wnioskach. Nie twierdzą, że rozwiązały dermatologię. Mówią: zrobiliśmy krok. I to krok w dobrym kierunku.
Ale od kroku do kliniki droga wciąż daleka.
