AI Overview, czyli nowa twarz wyszukiwarki Google, popełnia błędy ortograficzne, które zawstydziłyby ucznia podstawówki. I choć brzmi to jak żart, za tym problemem stoi poważna architektoniczna ograniczoność modeli językowych.
Kluczowe fakty:
- Google AI Overview popełnia podstawowe błędy ortograficzne, twierdząc że w słowie "Google" są dwie litery "e", a słowo "journalism" pisze się "j-o-u-r-n-a-d-i-s-m".
- Problem zliczania liter w słowach to znane ograniczenie modeli językowych, które Google oficjalnie przyznało i nad którym pracuje.
- Modele oparte na architekturze transformer przetwarzają tekst jako tokeny i reprezentacje numeryczne, a nie pojedyncze litery, co jest przyczyną tych błędów.
Dwie litery „p” w słowie Google
Zapytajcie Google AI Overview, ile liter „e” jest w słowie „Google”. Odpowiedź? Dwie. Oczywiście jest tylko jedna. Ten sam system twierdzi, że w słowie „poop” jest dokładnie jedna litera „r”, że słowo „journalism” pisze się j-o-u-r-n-a-d-i-s-m, a nazwisko urzędującego prezydenta USA należy literować jako t-r-p-u-m.
To nie są odosobnione przypadki. To wzorzec.
Znany problem, nowy kontekst
Żarty z ortografii modeli językowych krążą po branży od lat. Klasyczny test to pytanie o liczbę liter „r” w słowie „strawberry” – większość LLM-ów odpowiada błędnie. Teraz jednak ten problem pojawia się w produkcie, który Google stawia w centrum swojej flagowej usługi, używanej przez miliardy ludzi każdego dnia.
Google w oświadczeniu przesłanym redakcji TechCrunch przyznaje krótko: „Counting within words has been a known challenge for LLMs, and we’re working to fix this particular issue” / „Zliczanie liter wewnątrz słów jest znany wyzwaniem dla LLM-ów i pracujemy nad naprawą tego konkretnego problemu.”
Krótkie, lakoniczne, bez przeprosin.
Na X wpis użytkownika @mersomas szybko zyskał viralowy zasięg:
Google is revamping its entire search engine to this btw
— mersomas (@mersomas) May 27, 2026
Dlaczego LLM-y nie umieją literować?
Żeby zrozumieć ten problem, trzeba zajrzeć pod maskę. LLM-y nie „czytają” tekstu tak jak człowiek. Modele oparte na architekturze transformer przetwarzają tekst jako tokeny – czyli fragmenty słów, sylaby albo całe wyrazy – i zamieniają je na reprezentacje numeryczne. Model nie widzi liter. Widzi liczby.
Matthew Guzdial, badacz AI i adiunkt na Uniwersytecie Alberty, tłumaczył to TechCrunch już wcześniej: „When it sees the word 'the,’ it has this one encoding of what 'the’ means, but it does not know about 'T,’ 'H,’ 'E.'” / „Kiedy model widzi słowo 'the’, ma jedno zakodowane znaczenie tego słowa, ale nie wie nic o literach 'T’, 'H’, 'E’.”
Sheridan Feucht, doktorantka badająca interpretowalność LLM-ów na Northeastern University, idzie krok dalej i mówi wprost, że idealny tokenizer prawdopodobnie nie istnieje: „My guess would be that there’s no such thing as a perfect tokenizer due to this kind of fuzziness.” / „Moje przypuszczenie jest takie, że nie istnieje coś takiego jak idealny tokenizer ze względu na tę rozmytość.”
Piotr Wolniewicz, Redaktor Naczelny AIPORT.pl: Ten przypadek jest symptomatyczny dla czegoś szerszego. Modele językowe są imponujące – rozwiązują problemy matematyczne, piszą kod, analizują dokumenty prawne. Ale mylą się w rzeczach, które dla człowieka są trywialne. I tu leży fundamentalne pytanie: czy powinniśmy budować na takich modelach systemy, które mają zastąpić tradycyjne wyszukiwarki? Widzę tu dwa scenariusze. Pierwszy – to chwilowe potknięcia, które Google naprawi szybko i pójdziemy dalej. Drugi – to sygnał, że obecna architektura LLM-ów ma pewne twarde ograniczenia, których nie da się obejść bez głębszych zmian. Nie wiem jeszcze, który scenariusz jest prawdziwy. Ale widzę jedno: użytkownicy zaczną ślepo ufać AI Overview tak samo, jak przez lata ufali pierwszemu wynikowi wyszukiwania. A to jest naprawdę niebezpieczne.
Nie pierwszy raz
To nie jest debiut AI Overview w roli bohatera wpadki. Kiedy Google po raz pierwszy wdrożyło tę funkcję, system cytował satyryczne wpisy z The Onion i Reddit, doradzając użytkownikom jedzenie kamieni i dodawanie kleju do pizzy. Teraz mamy literówki na poziomie przedszkola.
Świeższy przykład to ubiegłotygodniowy błąd, który Google już naprawiło: wyszukanie słowa „disregard” zwracało coś, co wyglądało jak definicja słownikowa, ale brzmiało: „Understood. Let me know whenever you have a new prompt or question!” – czyli standardowa odpowiedź chatbota, która przypadkowo trafiła do wyników wyszukiwania.
Co to oznacza dla użytkowników?
Kilka rzeczy warto mieć z tyłu głowy korzystając z AI Overview:
- Błędy literowe i licznikowe to nie bug do naprawienia w jednej aktualizacji – to strukturalna cecha obecnych LLM-ów
- AI Overview nie „rozumie” tekstu tak jak człowiek, tylko przetwarza wzorce statystyczne
- Wyniki wyglądają pewnie i autorytatywnie, nawet gdy są błędne
- Weryfikacja odpowiedzi AI przed jej użyciem to nie przesada, to konieczność
Zabawne czy niepokojące?
Zależy, kogo pytać. Dla inżynierów to ciekawostka techniczna. Dla milionów użytkowników, którzy nie wiedzą, czym jest token ani transformer, to po prostu „Google powiedziało”. I właśnie dlatego te głupie błędy ortograficzne są czymś więcej niż tylko memem na jeden dzień.
Badacze przyznają, że literowanie słów nie jest priorytetem w pracach nad LLM-ami, bo to nie tam leży ich główna wartość. Ale jeśli Google stawia te modele jako nową twarz wyszukiwania – drugiego co do ważności produktu w historii internetu – to poprzeczka musi być zawieszona wyżej.
Nawet jeśli chodzi tylko o poprawne przeliterowanie własnej nazwy.
