Anthropic ogłosiło wczoraj premierę Claude Fable 5, pierwszego publicznie dostępnego modelu klasy Mythos. To duży krok, ale firma od razu zastrzega: część zapytań nie trafi do Fable, lecz do starszego Opusa 4.8. I to świadomie.
Kluczowe fakty:
- Anthropic ogłosiło premierę Claude Fable 5 – pierwszego publicznie dostępnego modelu klasy Mythos, który wcześniej był dostępny wyłącznie dla wybranych organizacji w ramach tajnego programu Project Glasswing.
- Model klasy Mythos wykazał zdolność do autonomicznego wykrywania i łączenia podatności zero-day w systemach operacyjnych i przeglądarkach, co wcześniej wymagało doświadczonego pentestera.
- Fable 5 korzysta z zestawu klasyfikatorów AI, które przekierowują podejrzane zapytania do starszego modelu Claude Opus 4.8 w trzech obszarach: cyberbezpieczeństwo, biologia i chemia oraz destylacja modeli – ponad 95% sesji nie trafia jednak na żaden fallback.
Czym jest klasa Mythos i dlaczego była niedostępna?
Żeby zrozumieć, co się stało, trzeba cofnąć się do kwietnia. Wtedy Anthropic zaprezentowało Claude Mythos Preview w ramach tajnego programu Project Glasswing, do którego dostęp miały tylko wybrane firmy: AWS, Microsoft, Apple, CrowdStrike i jeszcze ponad 150 innych organizacji zajmujących się krytyczną infrastrukturą. Powód: model okazał się zdolny do autonomicznego wykrywania i łączenia podatności zero-day w głównych systemach operacyjnych i przeglądarkach. Coś, co wcześniej wymagało doświadczonego pentestera, Mythos robił sam, krok po kroku.
To było i ekscytujące, i przerażające jednocześnie.
Teraz Anthropic twierdzi, że opracowało wystarczająco mocne zabezpieczenia, by udostępnić model szerszej publiczności. Ale w nieco okrojonej wersji, nazwanej właśnie Fable 5.
Fable vs Mythos: ten sam model, inne zasady
Technicznie Fable 5 i Mythos 5 to ten sam model bazowy. Różni je wyłącznie to, które zapytania są blokowane. Nazwa pochodzi zresztą z łaciny: fabula to „to, co się opowiada”, tak jak greckie mythos. Filozofia nazewnictwa jest tutaj spójna z filozofią produktu.
Fable 5 działa z zestawem klasyfikatorów: oddzielnych systemów AI, które wykrywają próby nadużycia, w tym jailbreaki, i przekierowują podejrzane zapytania do Claude Opus 4.8. Dotyczy to trzech obszarów:
- Cyberbezpieczeństwo: eksploitacja podatności, ofensywne operacje hakerskie, obejście systemów obronnych
- Biologia i chemia: zapytania potencjalnie przydatne przy tworzeniu broni biologicznej lub chemicznej
- Destylacja modeli: próby masowego wyciągania wiedzy z Fable w celu trenowania konkurencyjnych modeli
Według Anthropic ponad 95% sesji nie trafia na żaden fallback. Czyli w praktyce dla zdecydowanej większości użytkowników Fable 5 zachowuje się dokładnie jak pełny Mythos.
Co potrafi Fable 5?
Stripe przetestowało model na bazie kodu Ruby liczącej 50 milionów linii. Migracja, która normalnie zajęłaby całemu zespołowi ponad dwa miesiące, skończyła się w ciągu jednego dnia.
GitHub, Cursor, Cognition: wszyscy mówią to samo. W testach Cognition na platformie FrontierCode, mierzącej jakość kodu produkcyjnego, Fable 5 osiąga najwyższe wyniki wśród dostępnych modeli. Mario Rodriguez z GitHuba ocenił to następująco:
„Claude Fable 5 is a real step forward for the developers GitHub serves. In our early testing, it took on complex, long-horizon coding tasks with a level of autonomy and reliability that exceeded previous benchmarks.” / „Claude Fable 5 to prawdziwy krok naprzód dla programistów, którym służy GitHub. W naszych wczesnych testach model podejmował złożone, długoterminowe zadania kodowania z poziomem autonomii i niezawodności, który przekroczył poprzednie benchmarki.”
W obszarze wizji model potrafi odtworzyć kod źródłowy aplikacji wyłącznie z zrzutów ekranu. Pobił też grę Pokémon FireRed korzystając jedynie z surowych obrazów z ekranu, bez żadnych dodatkowych narzędzi czy map. Poprzednie modele Clauda potrzebowały do tego specjalnych haków i pomocy zewnętrznych systemów.
W finansach: IMC odnotowało, że Fable 5 zdał ich testy analizy tradingowej niemal w całości. Hebbia wskazuje go jako najlepszy model do zaawansowanych zadań analitycznych na poziomie starszego analityka.
Nauka, czyli gdzie naprawdę robi się ciekawie
Mythos 5 to ta sama baza co Fable, ale z usuniętymi zabezpieczeniami w obszarze cybersecurity. Dostępny pozostaje tylko dla partnerów Project Glasswing i wkrótce dla wybranych badaczy biologicznych.
I tutaj wyniki są… zdumiewające. Wewnętrzni eksperci Anthropic przyspieszyli pewne etapy projektowania leków dziesięciokrotnie. Model samodzielnie, bez pomocy człowieka, doprowadził do opracowania kandydatów na leki dla 9 z 14 badanych celów białkowych. Obejmuje to m.in. punkty kontrolne układu odpornościowego i choroby neurodegeneracyjne.
Co więcej, Mythos 5 przeprowadził tygodniowe, autonomiczne badania genomiczne, zbierając dane z milionów komórek od 138 gatunków zwierząt, trenując własny model uczenia maszynowego i osiągając wyniki lepsze niż model opublikowany w „Science”, będąc przy tym 100 razy mniejszy.
Piotr Wolniewicz, Redaktor Naczelny AIPORT.pl:
To jest dokładnie ten moment, w którym AI przestaje być narzędziem wspierającym naukowców, a zaczyna być naukowcem. I to samo w sobie jest przełomowe, ale też lekko niepokojące. Kiedy model autonomicznie stawia hipotezy, które potem okazują się trafne, to pojawia się pytanie: jak weryfikujemy coś, czego sami nie wymyśliliśmy? Z drugiej strony tempo odkryć w biologii molekularnej ostatnich miesięcy wskazuje, że bez AI po prostu nie będziemy w stanie nadążyć za chorobami, które na nas nie czekają. Moim zdaniem Anthropic robi tutaj coś ważnego: nie puszcza wszystkiego luzem, ale też nie zamraża dostępu w nieskończoność. Pytanie, czy te klasyfikatory faktycznie wytrzymają presję dobrze finansowanych złych aktorów. UK AISI zdążył już poczynić pierwsze postępy w kierunku jailbreaka. To nie jest błahostka.
Cennik i dostępność: uwaga na datę graniczną
Fable 5 kosztuje 10 dolarów za milion tokenów wejściowych i 50 dolarów za milion tokenów wyjściowych. To mniej niż połowa ceny Mythos Preview.
Dla użytkowników subskrypcyjnych jest jednak pewien haczyk. Do 22 czerwca Fable 5 jest wliczony w plany Pro, Max, Team i Enterprise bez dodatkowych opłat. Od 23 czerwca zniknie z tych planów i będzie wymagał tzw. usage credits. Anthropic zapewnia, że przywróci model do standardowych subskrypcji, gdy tylko pojemność infrastruktury na to pozwoli, ale nie podaje żadnego konkretnego terminu.
Deweloperzy mogą używać modelu przez Claude API pod identyfikatorem claude-fable-5.
Nowa polityka retencji danych
Jedno, co przeszło stosunkowo niezauważone w całym zamieszaniu premierowym: Anthropic wprowadza obowiązkową 30-dniową retencję danych dla wszystkich klientów biznesowych korzystających z modeli klasy Mythos. Firma zapewnia, że dane nie będą używane do trenowania nowych modeli ani do żadnych celów poza bezpieczeństwem, a dostęp do nich jest logowany. Po 30 dniach mają być usuwane.
Dla wielu firm korporacyjnych, zwłaszcza tych działających pod europejskim prawem, to może być punkt wymagający uwagi przed wdrożeniem.
Tak czy inaczej, ta premiera zmienia coś w układzie sił na rynku. Nie dlatego, że pojawił się nowy model. Ale dlatego, że po raz pierwszy publicznie dostępny model AI ma tak wyraźnie opisany i udokumentowany limit własnych możliwości. I to jest może najciekawszy eksperyment w całej tej historii.
