Notion nie zaczął od drobnych poprawek. Zaczął od wyburzenia ścian. Kiedy okazało się, że stara architektura systemu AI nie daje rady obsłużyć tego, czego zaczęli wymagać użytkownicy, zespół inżynierów podjął decyzję, którą większość firm odkłada na wieczne nigdy: przebudowali wszystko od zera. Efekt to Notion 3.0 z GPT-5 jako sercem całego systemu agentów.
Kluczowe fakty:
- Notion przeprowadził całkowitą przebudowę architektury systemu AI, tworząc Notion 3.0, w którym GPT-5 pełni rolę centralnego modelu rozumującego koordynującego modularne agenty podrzędne.
- Agenty w nowym systemie potrafią przeszukiwać zasoby Notion, Slack i sieć, edytować bazy danych oraz syntetyzować odpowiedzi w ramach złożonych, wieloetapowych zadań zlecanych przez użytkownika.
- Od stycznia 2026 użytkownicy Notion mają możliwość ręcznego wyboru modelu językowego – GPT-5 jest ustawieniem domyślnym, ale nie jedyną dostępną opcją.
Skąd to radykalne podejście?
Historia zaczyna się pod koniec 2022 roku. W ciągu kilku tygodni od dostępu do GPT-4 Notion zdążył wdrożyć asystenta pisania, uruchomić funkcje Q&A w całej przestrzeni roboczej i głęboko zintegrować modele OpenAI z narzędziami do wyszukiwania i planowania. Szybko, sprawnie, imponująco.
Ale czas mijał i modele stawały się coraz bardziej zaawansowane. Użytkownicy przestali prosić AI o pomoc przy pojedynczych zdaniach. Zaczęli zlecać całe procesy. I wtedy wyszło szydło z worka.
Dotychczasowy schemat, czyli kierowanie modeli do wykonywania odizolowanych zadań, zaczął blokować możliwości platformy. Agenty musiały podejmować decyzje, koordynować narzędzia i radzić sobie z niejednoznacznością. Do tego celu sama inżynieria promptów to za mało.
„We didn’t want to retrofit the system. We needed an architecture that actually supports how reasoning models work.”
„Nie chcieliśmy dostosowywać systemu po fakcie. Potrzebowaliśmy architektury, która naprawdę wspiera sposób, w jaki działają modele rozumujące.”
Sarah Sachs, szefowa działu modelowania AI w Notion
GPT-5 pod maską, ale nie jedyny
Notion zastąpił łańcuchy promptów dla konkretnych zadań centralnym modelem rozumującym. Koordynuje on modularne agenty podrzędne, które potrafią przeszukiwać zasoby Notion, Slack i sieć, edytować bazy danych, syntetyzować odpowiedzi. Użytkownik przydziela zadanie na poziomie ogólnym, powiedzmy zebranie opinii interesariuszy, a agent planuje, realizuje je i zdaje relację.
I tu trzeba powiedzieć wprost: GPT-5 to default, ale nie monopol. Od stycznia 2026 użytkownicy mogą ręcznie wybierać model językowy, w tym GPT-5.2, Claude Opus 4.5, Gemini 3 lub tryb automatyczny, który dobiera model za nich. To ważna decyzja biznesowa Notion, bo oznacza, że platforma nie uzależnia się od jednego dostawcy.
Dlaczego GPT-5 wygrał testy?
Żeby potwierdzić, że zmiana architektury ma sens, Notion przeprowadził porównanie GPT-5 z innymi modelami. Nie na syntetycznych benchmarkach, ale na prawdziwych zadaniach użytkowników. Pytania z trybu badawczego, wieloetapowe rozumowanie, niejednoznaczne lub nieaktualne dane wejściowe.
Wyniki:
- o 7,6% lepsze wyniki niż modele konkurencji przy zadaniach opartych na realnych opiniach użytkowników
- o 15% lepsza wydajność przy trudnych pytaniach badawczych
- ponad 100% poprawy przy wieloetapowych zadaniach, jak aktualizowanie terminów czy analiza konkurencji
- jedyny model, który zalicza testy nawet przy sprzecznych lub nieaktualnych danych wejściowych
„We weren’t selecting for special tasks. We pointed it at high signal-value processes in our product. That’s where real model differences emerge.”
„Nie wybieraliśmy żadnych specjalnych zadań. Wskazaliśmy procesy o wysokiej wartości sygnałowej w naszym produkcie. To właśnie w takich przypadkach ujawniają się rzeczywiste różnice między modelami.”
Sarah Sachs, dyrektor ds. modelowania AI w Notion
Komentarz redaktora
Notion zrobił coś, na co większość firm software’owych nie ma odwagi — przyznał, że stary system jest za słaby i zaczął od nowa. To kosztuje czas, pieniądze i nerwy całego zespołu. Ale przynosi efekty.
Z drugiej strony nie zapominajmy, że to case study przygotowany we współpracy z OpenAI. Mamy tu do czynienia z materiałem marketingowym, nawet jeśli opartym na realnych danych. Liczby robią wrażenie, ale benchmarki zawsze można ustawić tak, żeby wygrał ten, kto płaci za reklamę.
Naprawdę intrygujące jest co innego. Notion pozwala użytkownikom wybierać między GPT-5, Claude i Gemini. To znaczy, że nie stawia wszystkiego na jedną kartę. Mądre. Bo modele się zmieniają, a kto za rok będzie najlepszy? Nikt nie wie. I właśnie dlatego otwarta architektura ma więcej sensu niż lojalność wobec jednego dostawcy.
Pytanie, które zadaję sobie po przeczytaniu tego: ile z tych „autonomicznych agentów” rzeczywiście działa bez nadzoru człowieka? Bo „agent planuje i zdaje relację” brzmi pięknie w prezentacji, ale w praktyce bywa różnie.
Piotr Wolniewicz, Redaktor Naczelny AIPORT.pl
Notion 3.0 i co potem
Notion 3.0 zadebiutował 18 września 2025 roku z agentami AI, które potrafią wykonywać dowolną czynność dostępną w platformie. Ale to nie był koniec.
W lutym 2026 roku (wersja 3.3) Notion uruchomił Custom Agents, które, w odróżnieniu od osobistego agenta działającego zadanie po zadaniu, pracują autonomicznie według harmonogramów lub wyzwalaczy opartych na zdarzeniach.
W kwietniu 2026 roku (wersja 3.4) koszt działania Custom Agents spadł o 35-50%. Nowe, lżejsze modele mogą zmniejszyć zużycie kredytów na jedno uruchomienie nawet dziesięciokrotnie.
Dla kontekstu: plan Business w cenie 20 dolarów miesięcznie za użytkownika daje dostęp do GPT-5.4, Claude Opus i Gemini 3 w jednym miejscu. Kupowanie tych samych modeli osobno kosztowałoby 60 dolarów miesięcznie, bez żadnej integracji z przestrzenią roboczą.
Co z tego wynika dla reszty rynku?
Podejście Notion to lekcja dla całej branży software’owej. Można ją streścić w kilku punktach, które sami zresztą sformułowali:
- testuj na realnych zadaniach, nie syntetycznych benchmarkach
- projektuj z myślą o autonomii modelu od samego początku
- pełna przebudowa jest tańsza niż nakładanie plastrów na stary kod
- przejrzystość promptów i dobre opisy narzędzi robią różnicę nawet przy najlepszych modelach
Łatwo powiedzieć, trudniej zrobić. Zwłaszcza jeśli masz produkt, z którego korzystają setki tysięcy firm i nie możesz pozwolić sobie na kilkumiesięczną przerwę techniczną. Notion jakoś to ogarnął. I to chyba najbardziej imponujące w tej historii.
