Aravind Srinivas, CEO Perplexity, rzucił właśnie tezę, która może na nowo zdefiniować to, jak oceniamy wartość firm AI. Nie liczba parametrów, nie przepustowość, nie liczba użytkowników. „Token value per watt per user” — tyle wartości ekonomicznej wyciągasz z każdego wata zużytego przez twój model, na każdego użytkownika. Kto to zoptymalizuje, wygra. Koniec historii.
Kluczowe fakty:
- CEO Perplexity, Aravind Srinivas, zaproponował nową metrykę oceny wartości firm AI – „token value per watt per user", mierzącą wartość ekonomiczną generowaną na każdy wat energii zużytej przez model na jednego użytkownika.
- Perplexity ogłosiło produkt Personal Computer – system automatycznie decydujący, czy dane zadanie AI przetworzyć lokalnie na urządzeniu użytkownika, czy przesłać do chmury, przy czym wrażliwe dane mają być kierowane wyłącznie do modeli lokalnych.
- Nowe narzędzie powstało we współpracy z Intelem, ma zostać udostępnione w lipcu i będzie działać na platformach takich jak Windows oraz NVIDIA RTX Spark.
Brzmi jak slogan z konferencji dla inwestorów? Może. Ale za tym stwierdzeniem stoi coś więcej niż PR.
Efektywność energetyczna jako nowy benchmark
Srinivas powiedział wprost w rozmowie z CNBC: firmy, które dziś zarabiają dużo, bo ich modele są drogie w użyciu, mogą się mylić co do swojej trwałości. „To krótkoterminowy wzrost przychodów” — stwierdził, odnosząc się do strategii opartej na wysokich marżach za dostęp do modeli.
Jego zdaniem zwycięzca będzie musiał jednocześnie balansować dokładność, opóźnienia, koszty, prywatność i inteligencję modeli. Wszystko razem. Nie jedno kosztem drugiego.
To nie jest tylko filozofia. Perplexity właśnie ogłosiło Personal Computer — narzędzie, które firma nazywa „orchestratorem”. W praktyce: system decyduje sam, czy dane zadanie AI przetworzyć lokalnie na urządzeniu użytkownika, czy wysłać do chmury. Rozwiązanie ma automatycznie kierować wrażliwe dane, takie jak dokumenty finansowe czy dane medyczne, do lokalnych modeli na urządzeniu, a bardziej złożone zadania do chmury. Użytkownik nie musi nic konfigurować.
System zostanie oficjalnie udostępniony w lipcu i jest zapowiedziany wspólnie z Intelem, a oprócz Windowsa ma działać też na platformach takich jak NVIDIA RTX Spark.
„Centrum danych trafia do twojego laptopa”
Srinivas użył zdania, które dobrze podsumowuje ambicje Perplexity: „The data center is coming to your laptop”. I nie chodzi tylko o metaforę. Firma od miesięcy buduje architekturę, w której granica między urządzeniem a chmurą jest płynna.
Wcześniejszy produkt Perplexity dzielił pracę dość czytelnie: lokalny dostęp do plików na urządzeniu, ciężkie obliczenia na serwerach Perplexity. Nowy hybrydowy orkiestrator daje systemowi możliwość samodzielnego rozumowania, gdzie każda część zadania powinna być wykonana — nie tylko który model zastosować, ale które fizyczne miejsce powinno przetworzyć dane.
To ważne nie tylko dla prywatności. To zmienia ekonomię całego modelu. Mniej ruchu do chmury, niższe koszty, szybciej, bezpieczniej.
Rozumiem entuzjazm, z jakim Srinivas mówi o efektywności energetycznej jako kluczowym wskaźniku. To rzeczywiście sensowne kryterium — szczególnie gdy branża AI pali prąd na potęgę, a inwestorzy zaczynają liczyć nie tylko ROI, ale i ślad węglowy. Ale mam pytanie, na które nie znam odpowiedzi: czy „hybrydowy orkiestrator” naprawdę chroni prywatność użytkownika, czy jedynie przesuwa moment, w którym dane trafiają poza urządzenie? Bo jeśli system sam decyduje, co wysyła do chmury, to zaufanie do tej decyzji musi być poparte czymś więcej niż obietnicą. Audyty, certyfikaty, przejrzystość kodu. Bez tego to marketing, a nie architektura prywatności.
Piotr Wolniewicz, Redaktor Naczelny AIPORT.pl
Perplexity kontra giganci — gra na różnych zasadach
Perplexity jest wyceniane na 20 miliardów dolarów. Anthropic i OpenAI mają wyceny sięgające odpowiednio niemal biliona i ponad 850 miliardów dolarów. To nie jest ta sama liga.
I Srinivas zdaje sobie z tego sprawę. Dlatego jego zakład nie polega na tym, żeby wygrać walkę modeli. Perplexity nie próbuje zbudować lepszego GPT-4 ani pokonać Claude’a w benchmarkach. Zamiast tego stawia na coś innego: neutralną warstwę orkiestracji, która działa z modelami różnych dostawców, na różnym sprzęcie, w różnych systemach operacyjnych.
Konkretny przykład: Claude Opus 4.7 jest teraz domyślnym modelem orkiestrującym dla Perplexity Computer. Kiedy Anthropic wypuszcza lepszy model, Perplexity automatycznie na tym korzysta. CEO przyznał w rozmowie z CNBC, że przychody firmy potroiły się od początku roku, właśnie „dzięki postępom modeli Anthropic”.
Konkurenci są jednocześnie partnerami. To nieortodoksyjna pozycja rynkowa.
Ale nie jest pozbawiona ryzyka:
- Microsoft ogłosił właśnie własne modele do kodowania i rozumowania
- Apple pracuje nad nową wersją Siri opartą na modelach Google
- OpenAI, Google i Anthropic intensywnie rozwijają własnych agentów AI
Innymi słowy: każdy, z kim Perplexity współpracuje, buduje jednocześnie coś, co może Perplexity zastąpić.
Skala, która zaskakuje
W kwietniu 2026 roku Perplexity raportowało 500 milionów dolarów annualizowanego przychodu. Dla porównania: jeszcze rok wcześniej te liczby były ułamkiem tego. W maju 2025 roku platforma przetwarzała 780 milionów zapytań miesięcznie, ponad trzy razy więcej niż w sierpniu 2024.
Perplexity Computer, uruchomiony w lutym 2026, to system agentowy orkiestrujący 19 różnych modeli AI, zdolny do realizowania złożonych, wielogodzinnych zadań niemal bez nadzoru użytkownika. Teraz Personal Computer dokłada do tego lokalną warstwę. Roadmapa się domyka.
Srinivas mówi o „trwałej przewadze”. W branży, gdzie modele się starzeją w kwartałach, a nie latach, to odważna deklaracja. Zobaczymy, czy orkiestracja naprawdę jest tym, czym twierdzi — przewagą nie do skopiowania. Albo czy za rok ktoś większy po prostu zrobi to samo, taniej i szybciej.
