Nowe badanie opublikowane wspólnie przez Harvard Business School i Perplexity rzuca twarde liczby na coś, co branża technologiczna od miesięcy tylko przeczuwa: agenci AI nie są po prostu szybszą wyszukiwarką. To zupełnie inny rodzaj narzędzia, który zmienia nie tylko tempo pracy, ale też to, jakiej pracy w ogóle się podejmujemy.
Kluczowe fakty:
- Badanie Harvard Business School i Perplexity oparte na 10 000 dopasowanych parach sesji wykazało, że agent AI Computer wykonuje średnio 26 minut pracy maszynowej na sesję, podczas gdy klasyczny asystent Search – zaledwie 33 sekundy, co oznacza 48-krotną różnicę.
- Wskaźnik niezadowolenia użytkowników po sesji był o 55% niższy dla Computer (1,3%) niż dla Search (2,9%), a agent częściej korzystał z zewnętrznych usług – w 7,9% sesji wobec 1,8% w przypadku Search.
- Według kontrfaktycznego scenariusza skonstruowanego przez badaczy, wykonanie tego samego zadania z pomocą Search i własnej pracy użytkownika zajmowałoby 269 minut, co w porównaniu do Computer przekłada się na oszczędność czasu rzędu 87% i kosztów na poziomie 94%.
Raport powstał na podstawie danych produkcyjnych z dwóch produktów Perplexity: Search (czyli klasycznego asystenta odpowiadającego na pytania) i Computer (agenta, który samodzielnie planuje i wykonuje wieloetapowe zadania). To ważne rozróżnienie metodologiczne. Badacze nie symulowali niczego w laboratorium. Analizowali zachowanie prawdziwych użytkowników, którzy korzystają z obu narzędzi na co dzień.
48-krotna różnica, której nikt nie spodziewał się zobaczyć w tabelce
Serce badania to 10 000 dopasowanych par sesji, gdzie użytkownicy próbowali wykonać to samo (lub bardzo podobne) zadanie raz przez Search, raz przez Computer. Wyniki są… wyraźne.
Computer wykonuje średnio 26 minut pracy maszynowej na sesję. Search: 33 sekundy. To 48-krotna różnica przy tych samych zadaniach. Mediana różni się mniej drastycznie (9 minut versus 14 sekund), ale i tak mamy tu ponad 40-krotny rozstrzał.
Czy ta autonomia kosztuje jakością? Nie. Wskaźnik niezadowolenia użytkowników w kolejnym kroku był o 55% niższy dla Computer niż dla Search. 1,3% wobec 2,9%. Agent działający dłużej i bardziej samodzielnie dostarczał odpowiedzi, po których ludzie rzadziej się skarżyli.
Computer też znacznie częściej sięga po zewnętrzne usługi. W 7,9% sesji wywoływał co najmniej jedno zewnętrzne połączenie (MCP lub API). W Search to było 1,8%. Nie tylko pracuje dłużej, ale też pracuje szerzej.
Oszczędność czasu: 87%. Kosztów: 94%
Tutaj zaczyna się naprawdę ciekawy fragment badania. Badacze skonstruowali kontrfaktyczny scenariusz: co by się stało, gdyby użytkownik wykonał to samo zadanie korzystając z Search i… własnych rąk do pracy?
Odpowiedź: 269 minut. Przy Computer + człowiek nadzorujący: 36 minut. Różnica wynosi 87%.
W przeliczeniu na koszty (z uwzględnieniem stawek godzinowych z danych BLS OEWS za maj 2025) przewaga rośnie do 94%. Dlaczego koszty spadają bardziej niż czas? Bo Computer zajmuje się pracą, która normalnie byłaby wykonywana przez wysoko opłacanych specjalistów. Stawka godzinowa programisty to nie stawka godzinowa pracownika introligatorni.
Model AI kosztuje przy jednym zadaniu 4-10 dolarów. Search kosztuje około 5 centów. Ale Search + człowiek wykonujący wszystko samodzielnie kosztuje per krok 2,05 dolara. Computer + człowiek nadzorujący: 16 centów.
Piotr Wolniewicz, Redaktor Naczelny AIPORT.pl:
Te liczby są imponujące, ale żebym był uczciwy, trzeba je czytać z pewną ostrożnością. Perplexity badało własnych użytkowników, własnymi narzędziami, we własnym produkcie. Metodologia jest transparentna i naukowcy z Harvardu dają tej pracy wiarygodność, ale nie zapominajmy: wnioski są korzystne dla firmy, która je finansowała. To nie znaczy, że są fałszywe. Znaczy, że czekamy na niezależną replikację.
Drugie pytanie, które mnie nurtuje: badanie pokrywa zaledwie 90 dni od startu nowego produktu, w oknie, kiedy użytkownicy to klasyczni early adopters. Entuzjaści, AI natywi, ludzie aktywnie poszukujący takich narzędzi. Jak te liczby będą wyglądać za rok, kiedy do agentic AI dotrze typowy pracownik biurowy, który nie jest szczególnie technologicznie zwinny?
Ale jest też coś, czego tej pracy nie można zabrać: po raz pierwszy mamy twarde, produkcyjne dane pokazujące, że agenci zmieniają nie tylko szybkość pracy, ale jej charakter. 23% zadań, których ci sami użytkownicy nie wysyłali do wyszukiwarki. To jest coś, o czym warto myśleć poważnie.
Zmiana nie jest tylko ilościowa. Jest jakościowa
I to jest, moim zdaniem, najważniejszy fragment całego raportu. Bo powiedzieć „agent działa szybciej” to jak powiedzieć „samochód jest szybszy od roweru”. Ciekawsze pytanie brzmi: dokąd jedzie?
Badacze zmierzyli to na kilka sposobów:
- Taksonomia Blooma: 76% zapytań do Computer wymagało myślenia wyższego rzędu, wobec 55% w Search. Zadania twórcze (Create-level) stanowiły 50% zapytań do Computer, versus 26% w Search.
- Przekraczanie granic zawodowych: Użytkownicy Computer wychodzili poza swój główny obszar zawodowy w 59% przypadków. W Search: 50%. Różnica wydaje się mała, ale przy skali milionów użytkowników oznacza coś istotnego.
- Szerokość wiedzy: Przeciętne zadanie w Computer wymagało ekspertyzy z 2,40 obszarów wiedzy (według klasyfikacji O*NET), wobec 1,74 w Search. Computer był trzy razy bardziej prawdopodobny, że będzie potrzebować trzech lub więcej domen.
I wreszcie: 23% zapytań do Computer dotyczyło zadań, których ci sami użytkownicy nigdy nie wysłali do Search. To znaczy, że agent nie tylko wykonuje to samo szybciej. Otwiera dostęp do pracy, której wcześniej w ogóle nie próbowano zlecić maszynie.
Gdzie koncentrują się te nowe zadania? Głównie w:
- programowaniu i tworzeniu stron internetowych,
- produkcji dokumentacji,
- wizualizacji danych i grafice.
Dokładnie tam, gdzie wykonanie ma większe znaczenie niż wyjaśnienie. Search tłumaczy. Computer produkuje.
Co to znaczy dla rynku pracy?
Autorzy badania (Jeremy Yang z Harvardu oraz Kate Zyskowski, Noah Yonack i Jerry Ma z Perplexity) sami piszą wprost: jeśli jeden człowiek z agentem może wykonać pracę, która wcześniej wymagała wielu ról, to długofalowy wpływ agentów nie zmieści się w metrykach prędkości i kosztu. Przejawi się w tym, jak praca jest dzielona, jak definiowane są role i jak budowane są zespoły.
To nie jest optymistyczna zapowiedź, ani pesymistyczna. To po prostu opis zmiany strukturalnej, która prawdopodobnie właśnie trwa.
Badanie jest dostępne w całości na arXiv pod numerem 2606.07489. Surowe dane z 90-dniowego okna obejmują okres od 27 lutego do 27 maja 2026 roku, czyli pierwsze trzy miesiące życia Perplexity Computer w produkcji.
Szybko. Może za szybko, żeby wyciągać ostateczne wnioski. Ale za wolno, żeby to ignorować.
