Podczas tegorocznej konferencji Google I/O dziennikarze mieli okazję przetestować prototyp okularów z wyświetlaczem AR zasilanym przez Gemini. Wrażenia są obiecujące, ale słowo „prototyp” robi tu całą robotę.
Kluczowe fakty:
- Google zaprezentowało na konferencji I/O prototyp okularów AR z wyświetlaczem zasilanych przez Gemini, które powstały we współpracy z Warby Parker, Gentle Monster i Samsungiem.
- Okulary wyświetlają informacje bezpośrednio na soczewce i działają zarówno z telefonami Android jak i iOS, oferując funkcje takie jak nawigacja, tłumaczenie na żywo czy identyfikacja obiektów.
- Prototyp umożliwia uruchomienie asystenta Gemini poprzez przytrzymanie prawej strony oprawki przez dwie sekundy, ale nie jest to jeszcze produkt gotowy do sprzedaży.
Nie te okulary, które trafią do sklepów
Zacznijmy od tego, czym przetestowane okulary nie są. To nie jest produkt, który wyląduje w sklepach w najbliższych miesiącach. Google wyraźnie zaznaczyło, że testowany egzemplarz to wciąż prototyp, który pozwala firmie swobodnie eksperymentować z technologią wyświetlania i jej wpływem na żywotność baterii. Kształt, dopasowanie, wymiary, dbałość o szczegóły – wszystko to wygląda inaczej niż w finalnej wersji. To trochę jak otwieranie silnika samochodu bez nadwozia: działa, ale nie tak jeździmy.
Okulary powstały we współpracy z Warby Parker, Gentle Monster i Samsungiem. Działają zarówno z telefonami z systemem Android, jak i iOS, co jest godnym odnotowania gestem w stronę użytkowników Apple.
Co potrafią te szkła?
Pierwsze wyświetlone na soczewce informacje robią wrażenie. W polu widzenia użytkownika pojawia się prosty ekran główny z widgetami – w prototypie były to pogoda i odliczanie do Google I/O. Można też ustawić szybki dostęp do konkretnych aplikacji, jak Google Maps czy Translate.
Żeby uruchomić Gemini, wystarczy przez dwie sekundy przytrzymać prawy bok oprawki. Rozlegnie się dźwięk startowy i asystent zaczyna słuchać. W wersji demo kamera uruchamiała się automatycznie razem z Gemini, ale docelowo użytkownik sam zdecyduje, czy chce ją włączać jednocześnie.
Co można zrobić głosem?
- poprosić o odtworzenie muzyki,
- zrobić zdjęcie lub zlecić Gemini jego edycję (np. „zamień tę osobę w postać z anime”),
- nawigować bez wyjmowania telefonu z kieszeni,
- tłumaczyć rozmowę w czasie rzeczywistym,
- identyfikować obiekty i zadawać o nie pytania.
Tłumaczenie i nawigacja jako killer features
Jeden z najmocniejszych momentów testu to tłumaczenie na żywo. Demonstrator mówił szybko po hiszpańsku – okulary automatycznie rozpoznały język, wyświetliły tekst po angielsku i jednocześnie przetłumaczyły go głosowo do ucha. Można sobie wyobrazić, że sam ten feature wystarczyłby wielu podróżnikom do podjęcia decyzji zakupowej.
Podobnie nawigacja: wystarczy powiedzieć Gemini, dokąd się chce trafić, nawet tak mgliście jak „najbliższa kawiarnia”. Okulary uruchamiają Google Maps na telefonie, ale ekranu dotykać nie trzeba. Wskazówki pojawiają się w polu widzenia. Kiedy patrzysz przed siebie, widzisz kolejny skręt. Kiedy patrzysz w dół, pojawia się mapa z niebieską kropką. Kiedy patrzysz w górę, mapa znika. Proste.
Komentarz redaktora
Obserwując te okulary, mam mieszane uczucia – i myślę, że warto je powiedzieć głośno. Z jednej strony to naprawdę intrygująca wizja: AI, która nie siedzi w telefonie w kieszeni, ale jest przy tobie dosłownie cały czas, dosłownie w polu widzenia. Tłumaczenie w czasie rzeczywistym, nawigacja bez wyciągania telefonu, identyfikowanie obiektów – to brzmi jak konkretna wartość, nie gadżeciarstwo dla gadżeciarstwa. Z drugiej strony trudno nie zapytać: co właściwie robimy, kiedy decydujemy się na ciągłą obecność kamery i mikrofonu połączonych z chmurą Google’a? Każde zdjęcie, każde zapytanie, każda trasa – to dane, które gdzieś trafiają. Technologia jest obiecująca. Pytania o prywatność i o to, czy chcemy żyć w permanentnie „widzącym” środowisku, pozostają otwarte.
Piotr Wolniewicz, Redaktor Naczelny AIPORT.pl
Wyświetlacz tylko nad prawym okiem – i lekkie zmęczenie
Prototyp ma jeden wyświetlacz, umieszczony nad prawym okiem. Platforma docelowo ma obsługiwać zarówno jeden, jak i dwa wyświetlacze. Obraz w teście był nieco rozmazany, choć testerka przypisuje to swoim szkłom kontaktowym z różną korekcją na każde oko. Kiedy zamknęła jedno, obraz ostrzał – ale szybko pojawiło się zmęczenie oka. Trudno ocenić, czy to kwestia prototypu, prescripcji, czy samej technologii.
W pamięci warto też zachować jedną liczbę: 45 sekund. Tyle czasu na zatłoczonym Wi-Fi podczas I/O trwało przetworzenie i zwrócenie zdjęcia zamienionego przez Gemini w postać anime. W warunkach normalnego użytkowania powinno być szybciej, ale to sygnał, że pipeline między okularami a chmurą jest miejscem, które jeszcze wymaga dopracowania.
Audio-only już jesienią, wyświetlacz – później
Google idzie dwutorowo. Jesienią tego roku mają pojawić się okulary wyłącznie z dźwiękiem – bez wyświetlacza, ale z dostępem do Gemini, muzyką, połączeniami i aparatem. Tłumaczenie będzie działać i tam, tyle że tekst zobaczymy na ekranie telefonu, nie w soczewkach.
Wersja z wyświetlaczem to następny krok. Google zapowiedziało rozszerzenie programu zaufanych testerów jeszcze w tym roku. Kiedy dokładnie okulary trafią do sprzedaży? Tego firma na razie nie zdradza.
Wyraźnie widać, że Google wie, iż nie może pozwolić sobie na kolejne „Glass” – spektakularną klęskę produktową, która przez lata ciążyła na całej kategorii. Tym razem firma idzie ostrożnie, testuje zewnętrznie, partneruje z rozpoznawalnymi markami okularowymi i nie obiecuje dat, których nie jest pewna. To rozsądne. I prawdopodobnie konieczne, skoro Meta ze swoimi Ray-Ban Stories zbudowała już realne oczekiwania rynkowe wobec noszalnej AI.
Wyścig okularowy trwa. Google dopiero strzela z bloku startowego.
