Wpis Matta Shumera na X zebrał prawie 50 milionów wyświetleń w ciągu kilku dni. Branża AI oszalała z podekscytowania, część komentatorów ogłosiła nadejście nowej ery, a Gary Marcus postanowił to wszystko ochłodzić.
O co chodzi? Shumer, przedsiębiorca technologiczny, opublikował rozbudowany post, w którym twierdzi, że modele AI osiągnęły punkt przełomowy w kodowaniu – że piszą złożone aplikacje „bezbłędnie”, że programiści przestają być potrzebni do faktycznej pracy technicznej. Tekst napisany jest językiem rodem z kampanii direct marketingu lat 90: pogrubienia, wykrzyknienia, osobiste wyznania („wiem, że to prawda, bo to mi się przydarzyło jako pierwszemu”). Singularity vibes, jak to określił Marcus.
I am no longer needed for the actual technical work of my job. I know this is real because it happened to me first.
— Matt Shumer (@mattshumer_) Feb 2026
Marcus wchodzi z kontrą
Gary Marcus, kognitywista i jeden z najbardziej znanych sceptyków AI, skomentował post wprost: „uzbrojony hype, który mówi ludziom to, co chcą usłyszeć.” I wymienił konkretne problemy:
- Shumer powołuje się na benchmark METR, ale przemilcza, że kryterium sukcesu to 50% poprawności, nie 100%
- Nie cytuje badania Caltech/Stanford dokumentującego błędy rozumowania w tzw. modelach reasoning
- Ignoruje inne badanie METR, które pokazało, że programiści czasem wyobrażają sobie wzrost produktywności tam, gdzie go nie ma – a bywa, że ją tracą
- Pomija kwestię bezpieczeństwa automatycznie generowanego kodu, która staje się coraz poważniejszym problemem w środowiskach enterprise
Ale coś jednak się zmieniło
I tutaj Marcus nie jest tylko hejterem – przyznaje, że Shumer ma rację w jednej kwestii. Coś faktycznie zaszło w ostatnich miesiącach. Można teraz „puścić” model i pozwolić mu działać bardziej samodzielnie niż wcześniej.
Jeden z przyjaciół Marcusa, doświadczony programista, ujął to tak: „Coś wydarzyło się kilka miesięcy temu – możesz dać mu opis i pozwolić mu działać, i czasem… wychodzi z właściwą odpowiedzią. Czasem. Ale to czyni te systemy bardziej niebezpiecznymi. Im bliższe są wydawania się poprawnymi, tym bardziej ludzie im ufają, kiedy nie powinni.”
To zdanie warto zapamiętać.
Piotr Wolniewicz, Redaktor Naczelny AIPORT.pl: Widzę w tej historii coś, co dzieje się regularnie – technologia robi realny krok naprzód, a zaraz potem pojawia się ktoś, kto ten krok zamienia w skok do Księżyca. Shumer prawdopodobnie opisuje swoje autentyczne doświadczenie. Problem polega na tym, że ekstrapoluje je na całą branżę i na każdego użytkownika. AI do kodowania naprawdę przyspieszyła – ale „przyspieszyła” to nie „zastąpiła”. Pytanie, które mnie niepokoi najbardziej, brzmi: co się dzieje z kodem, który „wygląda dobrze”, ale zawiera subtelne luki bezpieczeństwa? I kto za to odpowiada, kiedy trafi na produkcję?
Wypalenie zamiast rewolucji
Jest jeszcze jeden wątek, który Shumer całkowicie pominął. Programiści, którzy najintensywniej korzystają z narzędzi AI, zaczynają raportować wypalenie. TechCrunch opisał to zjawisko tydzień temu. LLM pisze kod szybko, ale człowiek musi ten kod weryfikować, poprawiać, debugować – i robi to w tempie, do którego ewolucja go nie przygotowała.
Kelsey Piper, zazwyczaj optymistycznie nastawiona do AI, napisała o swoich doświadczeniach z Claude Code: „Czasem Claude jest absolutnie najgorszym współpracownikiem, jakiego miałeś. W pewnym momencie usunął wszystkie pliki fonemów angielskich dźwięków, które starannie zebrałam, i zastąpił je wygenerowanymi przez AI – wszystkie subtelnie niepoprawne.”
To nie jest opis rewolucji. To opis narzędzia z nieobliczalnymi momentami.
Coda: mała ironia
Marcus zwraca uwagę na żartobliwy, ale trafny punkt. Na końcu swojego wirusowego posta Shumer podziękował ludziom za review draftu. Po co mu ludzie do recenzji, skoro AI robi wszystko lepiej? I czemu nie kazał AI napisać samego posta?
Nikt tego głośno nie powiedział.
Wpis zebrał 50 milionów wyświetleń, bo ludzie chcą wierzyć w przełom. To naturalne. Ale chcenie nie czyni faktu. Marcus ma rację, że coś się zmieniło w możliwościach modeli. Nie ma racji w tym, że Shumer jest sam w swojej ekscytacji – ma jej po prostu za dużo i nie dba o dane.
Obserwujcie to miejsce. Prawdziwy przełom, kiedy nadejdzie, prawdopodobnie nie będzie potrzebował 50 milionów wyświetleń, żeby go zauważyć.
