Przez lata rozmawialiśmy o tym, czy AI może generować dezinformację. Teraz zaczynamy zadawać inne pytanie: czy AI potrafi jej się oprzeć? Dwa niezależne badania opublikowane w pierwszych miesiącach 2026 roku próbują to zmierzyć. I choć wyniki są częściowo optymistyczne, całościowy obraz nie napawa spokojem.
Kluczowe fakty:
- Badanie ISD objęło 300 zapytań w pięciu językach skierowanych do czterech chatbotów (ChatGPT, Gemini, Grok i DeepSeek), podzielonych na pytania neutralne, ukierunkowane i złośliwe, dotyczących rosyjskich narracji o wojnie w Ukrainie.
- Prawie 18 procent wszystkich odpowiedzi zawierało odwołania do rosyjskich mediów państwowych lub zasobów powiązanych z rosyjskimi operacjami informacyjnymi – przy pytaniach złośliwych odsetek ten wzrastał do 24 procent.
- ChatGPT cytował rosyjskie źródła najczęściej spośród wszystkich testowanych modeli i był najbardziej podatny na pytania sformułowane w prokremlowski sposób, natomiast Gemini wypadł najlepiej w przeprowadzonych testach.
Pierwsze pochodzi od Institute for Strategic Dialogue (ISD) z marca 2026. Drugie, finansowane ze środków unijnych, opublikowała organizacja Policy Genome w lutym. Razem tworzą dość szczegółowy portret tego, jak cztery najpopularniejsze zachodnie modele językowe radzą sobie z rosyjskimi narracjami dotyczącymi wojny w Ukrainie.
Metodologia: pytania neutralne, stronnicze i złośliwe
ISD przetestowało 300 zapytań w pięciu językach (angielskim, hiszpańskim, francuskim, niemieckim i włoskim) skierowanych do czterech chatbotów: ChatGPT, Gemini, Grok i DeepSeek. Pytania podzielono na trzy kategorie: neutralne, ukierunkowane (biased) i złośliwe (malicious), czyli takie, które explicite zakładały prokremlowską tezę i prosiły o źródła ją potwierdzające.
Tematami były: postrzeganie NATO, rozmowy pokojowe, pobór cywilów do ukraińskiej armii, uchodźcy ukraińscy w Europie oraz zbrodnie wojenne podczas rosyjskiej inwazji. Badacze używali nowych kont i połączeń VPN z krajów, w których języki zapytań były językami ojczystymi.
Gemini najlepszy, ChatGPT najgorzej wypadł przy złośliwych pytaniach
Prawie 18 procent ze wszystkich 300 odpowiedzi zawierało odwołania do rosyjskich mediów państwowych, stron powiązanych z rosyjskimi agencjami wywiadowczymi lub zasobów znanych z prowadzenia operacji informacyjnych. Neutralne pytania generowały takie źródła w 11 procentach przypadków. Pytania złośliwe już w 24 procentach.
Spośród wszystkich testowanych modeli ChatGPT cytował rosyjskie źródła najczęściej i był najbardziej podatny na pytania sformułowane w prokremlowski sposób. Grok cytował mniej więcej tyle samo rosyjskich źródeł niezależnie od rodzaju pytania, co sugeruje, że jego wyniki nie zależały od intencji pytającego. DeepSeek w pojedynczych przypadkach generował duże ilości treści powiązanych z Kremlem. Gemini najrzadziej serwował rosyjskie źródła i jako jedyny wyświetlał ostrzeżenia o bezpieczeństwie w odpowiedzi na złośliwe pytania.
Czytam te dane i nie wiem, czy powinienem czuć się lepiej, czy gorzej. Z jednej strony widać realny postęp w porównaniu z badaniami sprzed dwóch lat, gdy modele powtarzały prokremlowskie narracje znacznie częściej. Z drugiej: 18 procent to dużo. Szczególnie jeśli ChatGPT odpowiada dla 45 milionów użytkowników tylko w UE, a część z nich szuka informacji o wojnie nie w Google, lecz właśnie w chatbocie. Co więcej, badanie pokazuje coś, co mnie niepokoi bardziej niż same liczby: modele dają się prowadzić za rękę przez pytanie. Jeśli zapytasz agresywnie, prokremlowsko i pod tezę, dostajesz prokremlowskie źródła. To nie jest niezależny system informacyjny. To lustro pytającego. Czy jesteśmy gotowi jako społeczeństwo na to, że miliony ludzi kształtują swój pogląd na wojnę przez algorytm, który potwierdza to, czego szukają?
Piotr Wolniewicz, Redaktor Naczelny AIPORT.pl
Język ma znaczenie. Ale nie zawsze to samo znaczenie
Wyniki były zbliżone we wszystkich pięciu testowanych językach. Minimalnie więcej rosyjskich źródeł pojawiało się w zapytaniach po włosku i hiszpańsku, nieco mniej po francusku i niemiecku. Jednak różnice były na tyle małe, że trudno wyciągać daleko idące wnioski.
Inaczej do kwestii języka podeszło badanie Policy Genome. Ihor Samokhodskyi z Policy Genome przetestował sześć modeli AI, w tym zachodnie (ChatGPT, Claude, Gemini, Grok) oraz rosyjskie i chińskie (Yandex Alice i DeepSeek), zadając im siedem pytań dotyczących dobrze udokumentowanych faktów związanych z wojną w Ukrainie. Wyniki były uderzające: rosyjskie AI w czasie rzeczywistym cenzurowało prawdziwe odpowiedzi, chińskie AI przesuwało się ku kremlowskim narracjom, gdy pytano po rosyjsku, a zachodnie modele podważały faktyczną klarowność przez „fałszywą równowagę”.
Zachodnie modele (ChatGPT, Claude, Gemini, Grok) były w znacznej mierze dokładne, prawidłowo odpowiadając na 86-95 procent pytań i nigdy nie popierając wprost propagandy. Jednak w 5-19 procentach przypadków stosowały to, co autor nazwie „bothsidesismem”: przedstawiały udokumentowane fakty jako kwestię konkurujących perspektyw.
Jeden model na pytanie o to, kto sprowokował konflikt na Ukrainie, stwierdził, że „to zależy od perspektywy” i „nie jest to czarno-biała historia”. DeepSeek był zupełnie dokładny po angielsku i ukraińsku. Ale po rosyjsku używał kremlowskiej nomenklatury w 29 procentach odpowiedzi, nazywając rewolucję na Majdanie „zamachem stanu” i opisując inwazję Rosji jako „specjalną operację wojskową” mającą na celu „denazyfikację”.
Alice, czyli jak wygląda cenzura w czasie rzeczywistym
Samokhodskyi udokumentował też coś, co jest trudniejsze do zmierzenia, ale chyba najważniejsze. Nagrał wideo pokazujące, jak rosyjski chatbot Alice generuje prawdziwą odpowiedź na temat masakry w Buczy, a następnie automatycznie nadpisuje ją odmową przed pokazaniem użytkownikowi. To celowa, działająca w czasie rzeczywistym cenzura.
Wideo jest dostępne na YouTube:
To nie jest głupi model, który nie zna faktów. To model, który zna fakty i aktywnie je ukrywa.
Stare badania były gorsze. Progres jest, ale kontekst się zmienił
Warto spojrzeć na to w szerszej perspektywie czasowej. W marcu 2024 roku organizacja NewsGuard przetestowała dziesięć chatbotów i odkryła, że powtarzają fałszywe narracje sieci Pravda w 34 procentach przypadków, odmówiły odpowiedzi w 18 procentach, a obaliły dezinformację tylko w 48 procentach. Badanie z jesieni 2025 roku, przeprowadzone przez naukowców z Manchesteru i Bern, odnotowało propagandę jedynie w 5 procentach odpowiedzi, a linki do prokremlowskich źródeł w 8 procentach. Większość modeli oznaczyła te domeny jako niewiarygodne.
Poprawa jest realna. Problem w tym, że jednocześnie:
- chatboty zastępują wyszukiwarki jako podstawowe źródło informacji dla rosnącej liczby użytkowników,
- skala tych narzędzi jest dziś nieporównywalnie większa niż w 2024 roku,
- ChatGPT zbliża się do progu 45 milionów użytkowników w UE, co oznaczałoby wyższy poziom nadzoru regulacyjnego jako Very Large Online Search Engine (VLOSE) w ramach Aktu o Usługach Cyfrowych (DSA).
Co z tym zrobić?
ISD rekomenduje m.in., aby firmy AI stworzyły wspólne repozytorium źródeł przypisywanych państwom i regularnie je aktualizowały, a rosyjskie media państwowe były albo blokowane, albo oznaczane kontekstem informującym o ich pochodzeniu i powiązaniach.
Samokhodskyi apeluje o systemowe śledzenie narracji przez europejskie instytucje i niezależne audyty modeli AI finansowane ze środków publicznych, a nie poleganie na raportach samych firm. Wskazuje też na paradoks: zachodnie firmy AI ograniczają dostęp do swoich modeli w krajach objętych sankcjami, co w efekcie pozostawia tamtejszych użytkowników z Yandexem i DeepSeekiem. W czasie zimnej wojny Zachód starał się dotrzeć z Głosem Ameryki do obywateli sowieckich. Dziś prywatne firmy robią dokładnie odwrotnie.
Nie twierdzę, że ta analogia jest idealna. Ale pytanie jest dobre.
