Anthropic opublikował właśnie jeden z najbardziej niepokoją cych dokumentów w historii branży AI. Nie chodzi o kolejny raport o zagrożeniach z dystansu. Chodzi o twarde dane z wnętrza firmy, która sama buduje jedne z najpotężniejszych modeli na świecie. I która teraz mówi wprost: jesteśmy bliżej punktu bez powrotu, niż ktokolwiek się spodziewał.
Kluczowe fakty:
- W maju 2026 roku ponad 80% kodu trafiającego do produkcji w Anthropic zostało napisane przez Claude'a, podczas gdy przed lutym 2025 wskaźnik ten był jednocyfrowy. Przeciętny inżynier w firmie merguje dziś 8 razy więcej kodu dziennie niż w 2024 roku.
- W testach optymalizacji kodu trenującego modele AI, Claude Opus 4 osiągał w maju 2025 trzykrotne przyspieszenie względem punktu startowego, natomiast rok później wersja Mythos Preview osiągnęła 52-krotne przyspieszenie na tym samym zadaniu.
- Dokument zatytułowany "When AI builds itself" został opublikowany przez Anthropic Institute i dotyczy zjawiska tzw. recursive self-improvement, czyli zdolności systemów AI do samodzielnego ulepszania kolejnych wersji samych siebie bez udziału ludzi.
Dokument, opublikowany przez Anthropic Institute pod tytułem „When AI builds itself”, to coś między techniczną analizą a ostrzeżeniem egzystencjalnym. Napisali go Marina Favaro, szefowa badań wewnętrznych, i Jack Clark, dyrektor ds. polityki. Główny temat to tzw. recursive self-improvement, czyli zdolność systemów AI do samodzielnego ulepszania kolejnych wersji samych siebie, bez udziału ludzi.
Brzmi jak science fiction. Problem w tym, że dane, które Anthropic właśnie ujawnił, są całkowicie realne.
Liczby, które trudno zignorować
Zacznijmy od tego, co firma zmierzyła u siebie. W maju 2026 roku ponad 80% kodu trafiającego do produkcji w Anthropic zostało napisane przez Claude’a. Przed launchem Claude Code w lutym 2025 ten wskaźnik był jednocyfrowy. Przeciętny inżynier w firmie „merguje” dziś 8 razy więcej kodu dziennie niż w 2024 roku.
To nie jest wzrost o kilkanaście procent. To zmiana rzędu wielkości.
Ale Anthropic poszedł dalej i pokazał coś jeszcze bardziej wymownego. Regularnie testuje Claude’a na tym samym zadaniu: optymalizacji kodu trenującego małe modele AI. W maju 2025 Claude Opus 4 osiągał trzykrotne przyspieszenie względem punktu startowego. Rok później, w wersji Mythos Preview, to samo zadanie dawało 52-krotne przyspieszenie. Dla porównania, doświadczony ludzki badacz potrzebuje 4-8 godzin, żeby osiągnąć czterokrotne.
Już w tej jednej kategorii pracy badawczej Claude jest po prostu nieludzki. Dosłownie.
Trzy scenariusze, dwa są naprawdę niepokojące
Dokument Anthropic zarysowuje trzy możliwe przyszłości. Pierwszy scenariusz zakłada spowolnienie krzywej. Być może zbliżamy się do „łuku” na trajektorii wykładniczej, gdzie postęp wyhamowuje. Problemy z supply chainem, limity energetyczne, brak nowych przełomowych architektur. Autorzy nie wierzą jednak, żeby to był najbardziej prawdopodobny wariant.
Drugi scenariusz: AI przejmuje coraz więcej pracy badawczej, ale ludzie nadal wyznaczają kierunki. Firmy 100-osobowe robią robotę 10 000-osobowych. Rewolucja w pracy umysłowej, ale z ludzką ręką na kierownicy.
Trzeci scenariusz to właśnie pełny recursive self-improvement. AI projektuje swoje następne wersje bez udziału ludzi. Tempo postępu zależy już tylko od dostępności mocy obliczeniowej.
Autorzy przyznają, że nie wiedzą, jak wyglądałby świat, w którym to nastąpiło. I to samo w sobie mówi bardzo dużo.
Głos z redakcji
Czytam ten dokument i rozumiem, dlaczego Anthropic go opublikował. Liczby są zbyt poważne, żeby je przemilczeć. Jednocześnie nie mogę nie zauważyć pewnej sprzeczności: firma, która twierdzi, że chce zwolnić, właśnie przyznała, że jej inżynierowie są 8 razy bardziej produktywni dzięki AI i że 80% kodu pisze już maszyna. To nie jest firma hamująca. To firma jadąca z pełną prędkością i teraz pytająca innych, czy może czas wcisnąć hamulec.
Apel o globalną pauzę brzmi poważnie. Ale weryfikacja? Kto miałby sprawdzać, czy Chiny naprawdę zatrzymały swoje projekty? Autorzy sami przyznają, że training runy są o wiele łatwiejsze do ukrycia niż silosy rakietowe. Mimo to pytanie, czy w ogóle próbować budować takie mechanizmy koordynacji, jest bardzo ważne. Bo alternatywa, czyli wyścig bez żadnych reguł, to po prostu coraz bardziej ryzykowna droga.
Piotr Wolniewicz, Redaktor Naczelny AIPORT.pl
Pauza globalna? Łatwiej powiedzieć
Propozycja Anthropic jest prosta do opisania i trudna do wykonania. Firma chce, żeby czołowe laboratoria AI zawarły coś w rodzaju zimnowojennego traktatu o kontroli zbrojeń. Skoordynowane, weryfikowalne spowolnienie lub czasowe wstrzymanie prac nad nowymi modelami frontierowymi.
Autorzy sami przyznają, że napotkaliby tu zasadniczy problem techniczny. Training runy są wielokrotnie łatwiejsze do ukrycia niż silosy z rakietami. Ich „surowce” to ogólnodostępne procesory i dane. Bodźce do „cichej defektycji”, czyli kontynuowania prac w tajemnicy, są kolosalne, bo kto idzie pierwszy, przejmuje prowadzenie.
Do tego dochodzi geopolityka. Realna koordynacja wymagałaby współpracy m.in. z Chinami. Budowanie odpowiednich reżimów weryfikacyjnych zajęło dekady przy technologiach militarnych. Tyle czasu, zdaniem Anthropic, teraz nie ma.
David Sacks kontra „regulatory capture”
Nie wszyscy odbierają ten apel jako szczerą troskę o bezpieczeństwo. David Sacks, nieformalny doradca technologiczny administracji Trumpa i znany inwestor venture capital, od dłuższego czasu oskarża Anthropic o prowadzenie tzw. regulatory capture, czyli celowe lobbowanie na rzecz regulacji, które uderzyłyby w tańsze modele open source i wzmocniły pozycję zamkniętych, drogich systemów firmowych.
To zarzut, którego nie można zbagatelizować. Szczególnie biorąc pod uwagę, że Anthropic właśnie zamknął rundę finansowania o wartości 65 miliardów dolarów, wyceniony na niemal bilion dolarów, i kilka dni temu złożył poufne dokumenty IPO. Firma rośnie błyskawicznie i ma swoje bardzo konkretne interesy rynkowe.
Jednocześnie dane, które ujawniła, są wewnętrzne, mierzalne i trudne do podważenia. Motywacje mogą być mieszane. Fakty pozostają faktami.
Czego Anthropic naprawdę chce
Firma nie mówi „zatrzymajmy AI”. Mówi „potrzebujemy systemu, który pozwoliłby nam zatrzymać AI, gdyby okazało się to konieczne”. Różnica jest zasadnicza.
W najbliższych miesiącach Anthropic planuje zorganizować seria rozmów z decydentami politycznymi, badaczami i innymi laboratoriami. Celem jest odpowiedź na dwa pytania:
- Kiedy dokładnie możemy spodziewać się pełnego recursive self-improvement?
- Jak miałby wyglądać wiarygodny mechanizm weryfikacji globalnej pauzy?
Wyniki tych rozmów mają być opublikowane. Czas pokaże, czy to realna inicjatywa, czy PR. Anthropic Institute już teraz deklaruje, że będzie aktywnie budować infrastrukturę niezbędną dla takiego scenariusza.
Co wynika z danych, które ujawnili
Niezależnie od polityki, kilka faktów z tego dokumentu zmienia sposób myślenia o tym, gdzie jesteśmy:
- Długość zadań, które AI może samodzielnie wykonać, podwaja się co cztery miesiące. W marcu 2024 Claude radził sobie z 4-minutowymi zadaniami, rok później z 90-minutowymi, teraz z 12-godzinnymi. Jeśli trend się utrzyma, jesienią mogą to być zadania wielodniowe.
- W kwietniu 2026 Claude przeprowadził pierwsze od początku do końca autonomiczne badanie naukowe w dziedzinie bezpieczeństwa AI. Dwóch ludzkich badaczy w tydzień odzyskało 23% możliwej poprawy wskaźnika. Agenty AI w 800 godzin kumulatywnych odzyskały 97%.
- Claude zaczyna częściej niż ludzie sugerować właściwy „następny krok” w sesjach badawczych. W listopadzie 2025 robił to w 51% przypadków. W kwietniu 2026 już w 64%.
To nie są prognozy. To pomiary.
Pytanie, na które nikt jeszcze nie ma dobrej odpowiedzi, brzmi: kiedy „częściej niż ludzie” zamienia się w „zamiast ludzi”. I kto wtedy trzyma ster.
