Gemini Avatar wchodzi w fazę szerszego udostępnienia. Kilka minut, skan twarzy, próbka głosu, i masz cyfrowego siebie zdolnego do mówienia, gestykulowania i pojawiania się w filmach, których nigdy nie nakręciłeś. Brzmi jak science fiction. Jest już dostępne.
Kluczowe fakty:
- Gemini Avatar to funkcja wbudowana w aplikację Gemini, ogłoszona podczas Google I/O 2026, napędzana modelem Gemini Omni, który konkuruje bezpośrednio z OpenAI Sora i Adobe Firefly.
- Proces tworzenia cyfrowego awatara trwa kilka minut i obejmuje skan twarzy z kilku kątów oraz próbkę głosu polegającą na głośnym odczytaniu losowych liczb.
- Po konfiguracji użytkownik może przywoływać swojego awatara w czatach Gemini za pomocą komend takich jak @me, a wygenerowane klipy odwzorowują twarz, głos i mimikę właściciela konta.
Co to jest Gemini Avatar i jak działa
Ogłoszone przy okazji Google I/O 2026 w maju narzędzie Avatar to funkcja wbudowana bezpośrednio w aplikację Gemini. Napędza ją nowy model Gemini Omni, który Google zaprezentowało jako swoją najbardziej agresywną odpowiedź na rynek generatywnego wideo, bezpośrednio rywalizując z OpenAI Sora czy Adobe Firefly.
Jak to wygląda w praktyce? Wchodzisz w ustawienia aplikacji Gemini, wybierasz opcję Avatar i przechodzisz przez kilkuminutowy proces rejestracji. Kamera przednia skanuje twarz z kilku kątów, a system prosi o głośne odczytanie losowych liczb, aby zmapować strukturę głosu. To wszystko. Kilka sekund później Google generuje cyfrową wersję ciebie, kompletną z twoją twarzą i głosem.
Po zakończeniu konfiguracji możesz przywoływać swojego awatara bezpośrednio w czatach Gemini, wpisując komendy takie jak @me lub @twoja_nazwa_użytkownika.
Poniżej oficjalny wątek Google Gemini z instrukcją tworzenia awatara:
Easily add yourself to your video creations in Gemini.
Here’s how to create your own digital avatar that looks and sounds like you with Gemini Omni. 🧵
— Google Gemini (@GeminiApp) June 1, 2026
Realizm, który niepokoi
Kilka redakcji technologicznych już przetestowało funkcję na własnej skórze. Wrażenia są… niejednoznaczne.
Dziennikarze opisują, że skonfigurowanie awatara zajmuje dosłownie pięć minut, po których wygenerowane klipy pokazują ich samych śpiewających do dinozaura w parku czy surfujących pod Golden Gate Bridge, z fotorealistycznym tłem. Jeden z autorów opisuje to wprost: klon był uderzająco, niepokojąco podobny, mimo drobnych niedoskonałości.
Doświadczenie jest tak dokładne pod względem mowy, tonu i mimiki, że skłania do pytań o przyszłość tożsamości i rzeczywistości.
I tu właśnie zaczyna się ciekawa rozmowa.
Obserwuję branżę AI wystarczająco długo, żeby nie wpadać w panikę przy każdej nowej funkcji. Ale Gemini Avatar to coś, przy czym naprawdę warto chwilę się zatrzymać. Z jednej strony to narzędzie z oczywistym potencjałem twórczym, szczególnie dla twórców treści, marketerów, nauczycieli. Z drugiej, mamy tu do czynienia z demokratyzacją technologii deepfake na skalę, jakiej dotąd nie było. Wcześniej stworzenie wiarygodnego klonu głosowo-wizualnego wymagało wiedzy technicznej i drogiego sprzętu. Teraz wystarczy telefon i płatna subskrypcja. Pytanie, które mnie nurtuje: czy zabezpieczenia, które Google wbudowało w ten system, naprawdę wystarczą? I kto poniesie odpowiedzialność, gdy awatar trafi w niepowołane ręce?
Piotr Wolniewicz, Redaktor Naczelny AIPORT.pl
Warunki i zabezpieczenia, bo Google wie, że to ryzykowne
Google nie udaje, że funkcja jest całkowicie bezpieczna. Firma ma surowe wytyczne i ograniczenia dotyczące generowania treści deepfake. Narzędzie jest przeznaczone wyłącznie do tworzenia własnego awatara, nie cudzego. Możesz też w każdej chwili usunąć awatara, a Google obiecuje wtedy wymazanie zdjęć i danych głosowych użytych do jego stworzenia.
Każdy wygenerowany materiał jest oznaczany niewidocznym dla oka znakiem wodnym SynthID. Google ogłosiło przy okazji I/O, że SynthID oznaczył już ponad 100 miliardów wygenerowanych przez AI obrazów i filmów, a OpenAI, ElevenLabs i Kakao adoptują ten standard.
Zasady korzystania z funkcji to:
- Wyłącznie dla użytkowników powyżej 18 roku życia
- Dostępne tylko w płatnych planach Gemini (AI Pro, AI Plus lub Ultra)
- Zakaz tworzenia awatarów innych osób
- Każde wideo z limitem generowania, resetowanym co kilka godzin
- Obowiązkowy znak wodny SynthID na każdym klipie
Ale znak wodny to nie tarcza kuloodporna
I tu pojawia się problem. Deweloper opublikował na GitHubie darmowe, open source’owe narzędzie, które potrafi częściowo ominąć SynthID, usuwając sygnał znaku wodnego z obrazu wygenerowanego przez Gemini, zanim zostanie on udostępniony. Repozytorium zebrało ponad 1600 gwiazdek.
Innymi słowy: zabezpieczenie technicznie istnieje, ale już teraz ktoś pokazał, jak je obejść. To nie jest zarzut wobec Google. To raczej opis stanu branży, gdzie każde zabezpieczenie jest punktem startowym dla kogoś, kto chce je złamać.
Warto też przypomnieć historię, którą przy okazji podobnych narzędzi przywoływać będziemy jeszcze długo. 23-letnia kobieta z reportażu DOCO Woman Sold Her Face to AI for $1,000 bez konsultacji z prawnikiem podpisała kontrakt, na mocy którego sprzedała prawa do swojego wizerunku na zawsze, kuszona szybkim zarobkiem równowartości około 7300 złotych. To nie jest historia o głupocie. To historia o tym, jak mało ludzie rozumieją wartość własnego wizerunku w dobie AI i jak nieodwracalne mogą być pewne decyzje.
Nowa era treści, nowe pytania
Gemini Avatar to część większego ekosystemu Gemini Omni, który Google pozycjonuje nie jako niezależną zabawkę kreatywną, ale jako rdzenną infrastrukturę przechodzącą przez każdą powierzchnię, którą firma posiada. Edytowanie wideo przez rozmowę to tylko punkt wejścia.
Technologia bazuje na rozwiązaniu Android XR Likeness i jest zatem głęboko osadzona w długoterminowej architekturze Google. To nie jest eksperyment. To produkt, który Google traktuje poważnie i zamierza rozwijać.
Zresztą patrząc na tempo ostatnich miesięcy, historycznie stworzenie wiernego cyfrowego bliźniaka wymagało specjalistycznego oprogramowania, drogiego sprzętu i wielu godzin pracy. Dziś zajmuje to dwie minuty i kosztuje tyle, co miesięczna subskrypcja streamingu.
Pytanie nie brzmi już, czy ta technologia istnieje. Ona istnieje i ląduje na telefonach milionów użytkowników. Pytanie brzmi: czy jako społeczeństwo, jako regulatorzy, jako zwykli ludzie, jesteśmy na to gotowi.
