W poniedziałek, 1 czerwca, w Teatrze Wielkim w Warszawie zdarzyło się coś, co kilka lat temu brzmiałoby jak scenariusz science fiction. Polska firma wyceniana na 11 miliardów dolarów urządziła własny szczyt technologiczny w jednym z najbardziej prestiżowych miejsc w Europie, przy pełnej widowni 2500 osób i z prezydent Rzeczypospolitej w pierwszym rzędzie.
Kluczowe fakty:
- ElevenLabs, polska firma założona w 2022 roku przez Matiego Staniszewskiego i Piotra Dąbkowskiego, jest wyceniana na 11 miliardów dolarów, zatrudnia 400 osób i obsługuje klientów takich jak Deutsche Telekom, Revolut czy Square.
- Firma zaprezentowała dwie premiery technologiczne: Dubbing V2, który przenosi intonację, tempo i emocje mówcy do ponad 90 języków, oraz model text-to-speech Eleven V4, potrafiący szeptać, śpiewać i dynamicznie zmieniać emocje.
- ElevenLabs Summit odbył się 1 czerwca w Teatrze Wielkim w Warszawie, gromadząc 2500 uczestników oraz prezydent Rzeczypospolitej na widowni.
ElevenLabs Summit pod hasłem „Powrót do domu” był nie tylko pokazem siły. Był też świadomym komunikatem: ta firma wyrosła z Polski i nie zamierza o tym zapominać. Mati Staniszewski i Piotr Dąbkowski, obaj wychowani w Polsce, założyli ElevenLabs w 2022 roku z dość konkretnej frustracji, którą każdy z nas zna: fatalnego dubbingu w zagranicznych filmach. Cztery lata później ich firma jest warta więcej niż CD Projekt, zatrudnia 400 osób i obsługuje klientów pokroju Deutsche Telekom, Revolut czy Square.
Nowe modele, nowe możliwości
Centralnym punktem eventu były dwie premiery technologiczne. Pierwsza to Dubbing V2, czyli nowe podejście do automatycznego tłumaczenia audio. Zamiast opierać się wyłącznie na transkrypcie, model „kondycjonuje” się bezpośrednio na oryginalnym wykonaniu, przenosząc intonację, tempo i emocjonalny charakter mówcy do innego języka. W praktyce oznacza to, że dub nie brzmi jak czytanie z kartki, lecz jak oryginalna wypowiedź tej samej osoby. System obsługuje ponad 90 języków, a synchronizacja ze ścieżką wideo odbywa się automatycznie.
Druga premiera to model text-to-speech Eleven V4. Potrafi szeptać, śpiewać i błyskawicznie przeskakiwać między emocjami. Staniszewski ujął to prosto: „Można zbudować inteligentny system, ale jeśli AI brzmi robotycznie, nie zyska zaufania” („You can build an intelligent system, but if the AI sounds robotic, it won’t gain trust”). I tutaj właśnie tkwi sedno całej filozofii firmy: technologia jest tylko tak dobra, jak naturalne jest jej brzmienie.
Turysta pyta, agent rezerwuje
Ale prawdziwą gwiazdą wieczoru był pokaz systemu agentowego dla branży turystycznej. Na żywo, bez wcześniejszego montażu, asystent głosowy rozpoznał zdjęcie Teatru Wielkiego, zaproponował zakup biletów na balet, sprawdził kiedy przylatują znajomi użytkownika (z jego kalendarza Google) i wysłał bilety przez WhatsApp. Kulminacją był spersonalizowany przewodnik po teatrze, mówiący głosem sklonowanym od Piotra Fronczewskiego, zarówno po polsku, jak i po angielsku.
Widzę tu dwa równoległe problemy. Z jednej strony ta demonstracja jest naprawdę imponująca technicznie i pokazuje kierunek, w którym zmierza obsługa klienta w turystyce. To może być autentyczna zmiana dla milionów podróżnych. Z drugiej strony mam pytanie, które zostawiam bez odpowiedzi: czy jesteśmy gotowi na świat, w którym agent głosowy ma dostęp do naszego kalendarza, zna nasze plany podróżne i działa w naszym imieniu bez wyraźnej każdorazowej zgody? Kto odpowiada, gdy coś pójdzie nie tak? Entuzjazm prezentacyjny to nie to samo co polityka prywatności. I właśnie tego rodzaju pytania powinniśmy zadawać, nim technologia rozsieje się szerzej.
Piotr Wolniewicz, Redaktor Naczelny AIPORT.pl
PKO BP, InPost i LOT już testują
Summit nie był tylko pokazem możliwości, był też forum dla polskiego biznesu. I tu padły konkretne deklaracje:
- PKO Bank Polski prowadzi pilotaże rozwiązań głosowych ElevenLabs w ramach wewnętrznej strategii „AI everywhere”
- InPost zaprezentował asystenta zakupowego z głosem naturalnym, zintegrowanego z InPost Pay, którego maskotką stał się cyfrowy pies „von Halsky”. Po testach firma planuje wdrożenie dla 17 milionów użytkowników w Polsce
- PLL LOT używa agentów głosowych do obsługi rezerwacji pasażerskich
- NFZ w ramach Centralnej Rejestracji wdraża rozwiązanie, które ma ograniczyć liczbę nieodbytych wizyt, liczonych dotąd w milionach rocznie
To nie są plany. To już działa.
Firma, która chce na giełdę
Warto spojrzeć na ElevenLabs przez liczby, bo te robią wrażenie. Runda serii D o wartości 500 milionów dolarów, poprowadzona przez Sequoia Capital, wyceniła spółkę na 11 mld USD. W rundzie uczestniczyli też Andreessen Horowitz, który czterokrotnie zwiększył zaangażowanie, oraz Lightspeed Venture Partners i BOND. W pierwszym kwartale 2026 roku roczne przychody powtarzalne przekroczyły barierę 500 milionów dolarów, w porównaniu do 350 milionów na koniec 2025 roku. W cztery miesiące firma urosła o blisko 43 procent.
Staniszewski otwarcie mówi o giełdzie. Nie jako o odległej wizji, lecz jako o kolejnym etapie budowania. Na razie jednak firma skupia się na tym, co nazywa „złotą erą dla klienta”, czyli na świecie proaktywnych asystentów głosowych, które nie czekają na polecenie, lecz same inicjują działania i rozwiązują problemy bez formularzy.
Prezydent klaskał, Chopin się kłaniał
Nie można pominąć kontekstu, bo był on dość wymowny. Na scenie Teatru Wielkiego pojawił się prezydent Karol Nawrocki, który podkreślił, że Instytut Pamięci Narodowej jako jedna z pierwszych instytucji publicznych sięgnął po technologię ElevenLabs, przy projekcie rekonstrukcji głosów polskich bohaterów, Jana Zumbacha i Jana Kowalewskiego. Porównał Staniszewskiego i Dąbkowskiego do Chopina i Marii Skłodowskiej-Curie. Zapowiedział też Fundusz Technologii Przełomowych jako instrument wsparcia innowatorów przez państwo.
Symbolika była oczywiście czytelna. I po części uzasadniona. Polska firma w Teatrze Wielkim, z prezydentem i głosem Fronczewskiego, to obraz, który jeszcze parę lat temu był po prostu niemożliwy.
Szczegóły dotyczące samego eventu znajdziecie też na oficjalnej stronie ElevenLabs Summit: https://summit.elevenlabs.io/warsaw
