Naukowcy z Gladstone Institutes stworzyli model AI, który nie patrzy na komórki jak na zamrożone zdjęcia – widzi je w ruchu, na przestrzeni całego życia człowieka. I nie poprzestaje na teorii: jego przewidywania zostały już zweryfikowane doświadczalnie na żywych myszach.
To nie jest kolejny chatbot ani generator obrazów. MaxToki to coś zupełnie innego – model temporalny, który analizuje trajektorie stanów komórkowych przez dziesiątki lat, od narodzin do dziewiątej dekady życia.
Problem, który hamował biologię obliczeniową od lat
Większość modeli AI w biologii ma wspólny problem: traktują komórkę jak zdjęcie. Podaj im transkryptom pojedynczej komórki – czyli odczyt aktywności genów w danej chwili – a powiedzą ci dużo o tym, co ta komórka robi teraz. Ale dokąd zmierza? Tego nie wiedzą.
To właśnie dlatego choroby związane ze starzeniem są tak trudne do modelowania. Choroba Alzheimera, niewydolność serca, zwłóknienie płuc – żadna z nich nie pojawia się z dnia na dzień. Rozwijają się latami, napędzane powolnymi zmianami w sieciach genów. Żeby je zrozumieć, potrzebujesz modelu, który myśli w kategoriach czasu, a nie chwili.
Jak działa MaxToki
MaxToki to model dekodera transformerowego – ta sama klasa architektury co duże modele językowe – ale wytrenowany na danych z sekwencjonowania RNA pojedynczych komórek. Dostępny jest w dwóch wariantach: 217 milionów i 1 miliard parametrów.
Kluczowym elementem jest tzw. rank value encoding. Zamiast podawać modelowi surowe liczby ekspresji genów, każda komórka jest reprezentowana jako posortowana lista genów według ich względnej aktywności. To podejście uwypukla geny o wysokim zakresie dynamicznym – takie jak czynniki transkrypcyjne – nawet jeśli w wartościach bezwzględnych są słabo wyrażone. Jest też odporniejsze na techniczne zniekształcenia między próbkami.
Trening przebiegał dwuetapowo:
- Etap 1: Wykorzystano zbiór Genecorpus-175M, czyli około 175 milionów transkryptomów z 10 795 zbiorów danych. Model uczył się przewidywać kolejny gen w rankingu – dokładnie tak, jak modele językowe przewidują kolejny token w zdaniu.
- Etap 2: Rozszerzono okno kontekstu z 4 096 do 16 384 tokenów za pomocą techniki skalowania RoPE. Pozwoliło to przetwarzać wiele komórek naraz, czyli całe trajektorie w czasie. Dane treningowe objęły około 22 milionów transkryptomów z 600 typów komórek od dawców w każdej dekadzie życia, od urodzenia do ponad 90. roku. Łącznie model przetrenowano na prawie bilion tokenów genowych.
Prompting w czasie, nie w chwili
Najciekawsza część to strategia promptowania. Kontekst dla modelu stanowi trajektoria dwóch lub trzech stanów komórkowych wraz z przedziałami czasowymi między nimi. Model może wykonać jedno z dwóch zadań:
Po pierwsze, podaj mu komórkę zapytania i trajekorię kontekstową – model przewidzi, ile miesięcy upłynęło, żeby dotrzeć do tego stanu. Po drugie, podaj mu przedział czasowy – model wygeneruje transkryptom komórki, która powstałaby po tym czasie.
Wyniki robią wrażenie. Mediana błędu przewidywania wieku dla modelu MaxToki wyniosła 87 miesięcy, podczas gdy dla bazowego modelu liniowego było to 180 miesięcy. A co ważne, model nigdy nie jest informowany wprost, z jakim typem komórki ma do czynienia – wywnioskuje to sam z kontekstu.
Komentarz redaktora
MaxToki to jeden z tych projektów, które naprawdę zatrzymują mnie przy czytaniu. Nie dlatego, że obiecuje nieśmiertelność – bo nie obiecuje. Ale dlatego, że atakuje konkretny, realny problem: biologię obliczeniową da się uprawiać „w czasie”, a nie tylko w jednej chwili. To zmiana paradygmatu, nie kolejny ulepszony klasyfikator.
Mam jednak dwa pytania, które zawsze się nasuwają przy tego rodzaju badaniach. Pierwsze: jak te wyniki skalują się na ludziach z konkretnymi chorobami, jeśli model był trenowany wyłącznie na zdrowych dawcach? Autorzy sami przyznają, że weryfikacja odbywała się na myszach i na danych post-mortem. To nie jest zarzut – to etap badań, na którym jesteśmy. Ale droga od „model przewiduje 15 lat przyspieszenia starzenia w zwłóknieniu płuc” do „wiemy, jak to zatrzymać u pacjenta” jest wciąż bardzo długa.
Drugie pytanie dotyczy dostępności. Kod i modele są otwarte – to świetna wiadomość. Ale czy te narzędzia są realnie dostępne dla mniejszych ośrodków badawczych bez dostępu do klastrów H100? To pytanie, którego branża AI zbyt rzadko sobie zadaje.
Piotr Wolniewicz, Redaktor Naczelny AIPORT.pl
Co model odkrył bez podpowiedzi
Tutaj robi się naprawdę interesująco. Analiza interpretowalności modelu 217M ujawniła, że około połowa głowic uwagi nauczyła się – samodzielnie, bez żadnych etykiet – zwracać znacznie większą uwagę na czynniki transkrypcyjne niż na inne geny. A czynniki transkrypcyjne to główne regulatory zmian stanów komórkowych. Model odkrył ich znaczenie bez nadzoru.
Potwierdzono też, że model nie produkuje uśrednionych reprezentacji. Klasyfikator doubletów wykazał, że około 95% wygenerowanych komórek to pojedyncze, realistyczne transkryptomy, a nie statystyczne hybrydy.
Choroba Alzheimera i odporność na nią
Jedna z najbardziej klinicznie istotnych obserwacji dotyczy właśnie tej choroby. W mikrogleju pobranym od pacjentów z Alzheimerem model wykazał przyspieszenie starzenia o około 3 lata w porównaniu do zdrowych osób w tym samym wieku. Wynik powtórzono na niezależnej kohorcie.
Co ciekawe, w tej samej kohorcie znaleźli się pacjenci z łagodnymi zaburzeniami poznawczymi oraz tzw. pacjenci odporni na Alzheimera – osoby z identycznymi zmianami neuropatologicznymi, ale bez objawów klinicznych. U nich model nie wykazał przyspieszenia starzenia mikrogleju. To sugeruje, że ta podgrupa może być chroniona przed specyficznym mechanizmem przyspieszonego starzenia komórkowego.
I to właśnie bez żadnych danych treningowych na temat choroby.
Od symulacji do żywego organizmu
MaxToki nie zatrzymał się na obliczeniach. Model wskazał nowe kandydatury genów napędzających starzenie w komórkach sercowych. Te wskazania przetestowano eksperymentalnie: w komórkach sercowych wyprowadzonych z ludzkich komórek iPSC oraz – co ważniejsze – w żywych myszach. W ciągu sześciu tygodni zaobserwowano mierzalne dysfunkcje sercowe.
To bezpośrednia linia od predykcji komputerowej do konsekwencji in vivo.
Model jest dostępny publicznie
Kod źródłowy oraz wytrenowane modele są dostępne na GitHubie i Hugging Face. Pełna dokumentacja metodologiczna jest dostępna w formie preprintu na bioRxiv: https://www.biorxiv.org/content/10.64898/2026.03.30.715396v1.full.pdf
Zaangażowanie NVIDIA przy infrastrukturze treningowej (stos BioNeMo, karty H100) sugeruje, że tego rodzaju modele będą coraz mocniej wchodzić w obszar biomedycyny korporacyjnej. Pytanie nie brzmi już „czy AI znajdzie zastosowanie w badaniach nad starzeniem”, ale „kto to skomercjalizuje pierwszy i na jakich warunkach”.
