Sztuczna inteligencja przeanalizowała ponad 410 tysięcy wpisów pacjentów na Reddit i znalazła coś, czego oficjalne badania kliniczne nie wychwyciły. Chodzi o leki GLP-1 na otyłość i cukrzycę, jedne z najszybciej rosnących terapii na świecie. I o pytanie, które po tym odkryciu trudno zignorować: czy nasze obecne systemy monitorowania bezpieczeństwa farmaceutycznego mają poważną lukę?
Kluczowe fakty:
- Zespół z Uniwersytetu Pensylwanii wykorzystał modele GPT od OpenAI do analizy ponad 410 tysięcy wpisów pacjentów na Reddit z okresu sześciu lat, dotyczących leków GLP-1 zawierających semaglutyd i tirzepatyd (m.in. Ozempic, Wegovy, Mounjaro).
- Analiza mediów społecznościowych ujawniła działania niepożądane, których nie wychwyciły oficjalne badania kliniczne, co wskazuje na lukę w tradycyjnych systemach monitorowania bezpieczeństwa farmaceutycznego.
- Według prof. Lyle'a Ungara badania kliniczne są zaprojektowane do wykrywania najpoważniejszych działań niepożądanych, przez co pomijają objawy uciążliwe dla pacjentów, ale trudno mierzalne i nieistotne statystycznie.
Badanie przeprowadzone przez zespół z Uniwersytetu Pensylwanii objęło wpisy z Reddit z okresu sześciu lat. Naukowcy szukali wzmianek o dwóch substancjach czynnych: semaglutydzie i tirzepatydzie, czyli składnikach leków takich jak Ozempic, Wegovy czy Mounjaro. Do analizy użyli modeli GPT od OpenAI. Sztuczna inteligencja przeszukała setki tysięcy wpisów, identyfikując wzorce objawów opisywanych przez realnych użytkowników, bez kwestionariusza, bez lekarza, bez protokołu badania.
I właśnie na tym polega sedno tego odkrycia.
Skąd ta luka między ulotką a rzeczywistością
Badania kliniczne są i pozostają złotym standardem oceny bezpieczeństwa leków. Ale mają jedną strukturalną słabość: zaprojektowane są tak, żeby wykryć najpoważniejsze i najczęstsze działania niepożądane. Objawy uciążliwe, ale trudno mierzalne, często po prostu wypadają poniżej progu statystycznej istotności.
Jak wyjaśnia profesor Lyle Ungar: „Clinical trials typically identify the most dangerous side effects of drugs, but they may not capture the symptoms that are most bothersome to patients; while social media is not representative, the large number of posts may reflect additional concerns” / „Badania kliniczne zazwyczaj pozwalają wykryć najpoważniejsze działania niepożądane leków, ale nie zawsze pokazują, które objawy najbardziej niepokoją samych pacjentów. Media społecznościowe nie są idealnym odzwierciedleniem całej populacji, ale ogromna liczba publikowanych tam wpisów może ujawniać dodatkowe kwestie warte uwagi”.
Do tego dochodzi kontekst samego leku. W przypadku leków GLP-1 dobrze udokumentowane są objawy ze strony przewodu pokarmowego, takie jak nudności, wymioty, biegunka i zaparcia, które mogą występować u 40-85 proc. pacjentów. Ale to, co pacjenci faktycznie zgłaszają na forach, to zupełnie inna lista.
Co znalazła AI w postach pacjentów
Wśród potencjalnych działań niepożądanych, które nie są szeroko opisywane w literaturze medycznej, uwagę badaczy zwróciły przede wszystkim dwie grupy objawów: zaburzenia związane ze zdrowiem reprodukcyjnym, w tym nieregularne cykle menstruacyjne, oraz problemy dotyczące regulacji temperatury ciała, takie jak dreszcze czy uderzenia gorąca.
Zmęczenie pojawiło się jako drugi najczęściej raportowany objaw, mimo że w istniejących badaniach klinicznych pojawia się znacznie rzadziej. Około 4 procent użytkowników zgłaszających działania niepożądane wspominało o zmianach miesiączkowych. To brzmi jak mała liczba. Ale przy bazie milionów pacjentek przyjmujących te leki na całym świecie, cztery procent to ogromna populacja, która może doświadczać czegoś, o czym medycyna jeszcze nie wie.
Jak podkreśla psycholog Jena Shaw Tronieri: „It is thought that these drugs act on the hypothalamus, the area of the brain responsible for regulating many hormones. That doesn’t automatically mean they cause menstrual disturbances or changes in body temperature, but these are issues worth investigating in a more systematic way” / „Uważa się, że leki te oddziałują na podwzgórze, czyli obszar mózgu odpowiedzialny za regulację wielu hormonów. Nie oznacza to automatycznie, że powodują zaburzenia menstruacyjne czy zmiany temperatury ciała, ale są to kwestie, które warto zbadać w bardziej systematyczny sposób”.
To badanie jest dla mnie dobrym przykładem tego, jak AI może działać jako narzędzie uzupełniające, a nie zastępujące klasyczną medycynę. Szybkość analizy, skala danych, brak filtrów klinicznych, to są realne zalety. Ale jednocześnie musimy być ostrożni. Forum internetowe to nie kohorta badawcza. Osoby z negatywnymi doświadczeniami są tam nadreprezentowane, dane są niekompletne, a sam algorytm może wzmacniać schematy, które w danych po prostu dominują. Pytanie, które powinniśmy stawiać, nie brzmi „czy AI może wykrywać skutki uboczne”, bo ewidentnie może. Pytanie brzmi: jakie procedury weryfikacji muszą istnieć, zanim taki sygnał trafi do regulatorów lub, co gorsza, do mediów jako gotowy fakt?
Piotr Wolniewicz, Redaktor Naczelny AIPORT.pl
Farmakowigilancja w dobie dużych modeli językowych
To badanie wpisuje się w szybko rosnący nurt tzw. pharmacovigilance opartej na AI. Tradycyjny system raportowania działań niepożądanych opiera się głównie na dobrowolnych zgłoszeniach lekarzy i producentów do organów takich jak FDA czy EMA. Problem w tym, że ten system jest strukturalnie nieszczelny. Jak wskazuje badanie z Uniwersytetu Kalifornijskiego w San Diego, dynamiczny rozwój rynku produktów konsumenckich sprawił, że potrzebne są nowe systemy identyfikowania zagrożeń, oparte na analizie mediów społecznościowych.
Przegląd literatury opublikowany na początku 2025 roku w PubMed potwierdza, że AI znacznie usprawniła pharmacovigilance, przyspieszając wykrywanie sygnałów i automatyzację raportowania. Techniki data mining i automatyczne wykrywanie sygnałów bezpieczeństwa skróciły czas identyfikacji zagrożeń, a modele predykcyjne pozwalają teraz przewidywać działania niepożądane zanim staną się szeroko raportowane.
Ale ta sama analiza stawia sprawę jasno: praktyczne zastosowanie AI w pharmacovigilance pozostaje w dużej mierze ograniczone do badań akademickich, a wdrożenia hamują problemy z jakością danych, bariery regulacyjne i brak wystarczająco przejrzystych algorytmów.
Innymi słowy: potencjał jest, ale droga od analizy postów na Reddit do zmiany ulotki leku jest jeszcze bardzo długa.
Jakie dane analizuje AI i dlaczego to ma znaczenie
Warto rozumieć, co właściwie analizują takie systemy. Źródła danych, które AI może przetwarzać, obejmują elektroniczne dokumentacje medyczne, platformy mediów społecznościowych, literaturę medyczną, spontaniczne raporty o zdarzeniach niepożądanych, dane z ubezpieczeń oraz bazy danych genomicznych. Łączenie tych różnorodnych strumieni danych daje bezprecedensowe możliwości wczesnego wykrywania sygnałów.
W przypadku badania z Pensylwanii model GPT musiał radzić sobie z jednym konkretnym wyzwaniem: użytkownicy opisują swoje objawy na dziesiątki różnych sposobów. Ktoś piszę „mdłości”, ktoś inny „chce mi się rzygać od tej igły w brzuch”, a jeszcze ktoś „mój żołądek kompletnie zwariował po Ozempicu”. AI musi rozumieć, że to ten sam sygnał.
Jak mówi Sharath Chandra Guntuku: „Clinical trials are the gold standard, but by nature they are time-consuming. Our method is not meant to replace them, but can capture signals much faster, which is particularly important when the popularity of a drug grows almost overnight” / „Badania kliniczne pozostają złotym standardem, ale z natury są czasochłonne. Nasza metoda nie ma ich zastąpić, ale może znacznie szybciej wychwytywać sygnały, co jest szczególnie istotne, gdy popularność leku rośnie niemal z dnia na dzień”.
Ograniczenia, których nie można pominąć
Uczciwość naukowa autorów badania zasługuje na odnotowanie. Sami podkreślają kilka rzeczy, które powinny ostudzić entuzjazm:
- Dane z Reddit nie są reprezentatywne dla całej populacji. Użytkownicy tej platformy to w większości młodsi mężczyźni ze Stanów Zjednoczonych.
- Osoby z negatywnymi doświadczeniami chętniej piszą w sieci niż te, które czują się dobrze.
- Wyniki nie dowodzą związku przyczynowego. Użytkownicy zgłaszali objawy podczas przyjmowania leków, ale nie oznacza to automatycznie, że lek je wywołał.
- Brakuje szczegółowych danych o stanie zdrowia osób publikujących wpisy.
To są poważne zastrzeżenia. I dobrze, że badacze je stawiają, bo w przestrzeni medialnej tego rodzaju badania bardzo łatwo zamieniają się w nagłówki pokroju „Ozempic niszczy hormony”. A to byłoby krzywdzące zarówno dla pacjentów, jak i dla nauki.
Co dalej z AI w bezpieczeństwie leków
Zespół z Pensylwanii zapowiada rozszerzenie badań na inne platformy i inne populacje, w tym analizę wpisów w różnych językach. To ważne, bo dotychczasowe dane są zdominowane przez anglojęzyczny Reddit, a profile działań niepożądanych mogą różnić się między populacjami.
Szerszy obraz jest jednak jasny. AI staje się transformacyjnym narzędziem zdolnym do przetwarzania dużych, wieloźródłowych zbiorów danych i wspierania proaktywnego monitorowania bezpieczeństwa leków. Pytanie nie brzmi już czy AI wejdzie do pharmacovigilance. Ona już tam jest. Pytanie brzmi, jak szybko instytucje regulacyjne, FDA, EMA, Urząd Rejestracji Produktów Leczniczych w Polsce, zbudują ramy prawne pozwalające na sensowne korzystanie z tych sygnałów.
Bo na razie mamy narzędzie. Brakuje procedury.
