Google wrzucił na iOS narzędzie do dyktowania o nazwie „AI Edge Eloquent”, które działa głównie lokalnie – bez potrzeby stałego połączenia z chmurą. Ruch jest wyraźnie wymierzony w rosnący rynek aplikacji transkrypcyjnych opartych na sztucznej inteligencji.
Premiera odbyła się w poniedziałek, praktycznie bez żadnego szumu medialnego. Żadnej konferencji, żadnego posta na blogu Google. Aplikacja po prostu pojawiła się w App Store.
Gemma napędza transkrypcję
Eloquent bazuje na modelach rozpoznawania mowy (ASR) z rodziny Gemma. Po pobraniu modeli na urządzenie możesz zacząć dyktować bez połączenia z internetem. Aplikacja wyświetla transkrypcję na żywo, a gdy zatrzymasz nagrywanie, automatycznie usuwa słowa wypełniające typu „um” i „ah”, wygładzając tekst.
To w zasadzie to, czego brakowało w standardowych narzędziach dyktowania. Zamiast dosłownej transkrypcji każdego zająknięcia, dostajesz czysty tekst.
Pod transkrypcją znajdziesz opcje transformacji:
- „Key points” – kluczowe punkty
- „Formal” – wersja formalna
- „Short” – skrócona
- „Long” – rozbudowana
Tryb lokalny vs chmura
Domyślnie aplikacja może korzystać z chmurowych modeli Gemini do edycji tekstu. Ale możesz to wyłączyć i działać w pełni lokalnie. Eloquent potrafi też importować słowa kluczowe, nazwiska i specjalistyczny żargon z Twojego konta Gmail. Albo możesz ręcznie dodać własne słowa do słownika.
Aplikacja przechowuje historię sesji transkrypcji i umożliwia przeszukiwanie. Pokazuje też statystyki – ile słów podyktowałeś, jakie było Twoje tempo słów na minutę.
Piotr Wolniewicz, Redaktor Naczelny AIPORT.pl:
Ciekawy ruch ze strony Google. Z jednej strony widzimy realne zapotrzebowanie na takie narzędzia – profesjonaliści, twórcy treści, osoby z niepełnosprawnościami, wszyscy mogą skorzystać na lepszej transkrypcji. Z drugiej strony pojawia się pytanie: dlaczego tak po cichu? Czy to testowanie rynku przed większym wdrożeniem na Androidzie? A może ostrożność wynikająca z poprzednich porażek produktowych? Warto też zastanowić się nad kwestią prywatności – opcja pracy offline to duży plus, ale import słów z Gmaila pokazuje, że Google wciąż szuka sposobów na integrację ze swoim ekosystemem. Co z tymi danymi się dzieje? Będziemy obserwować.
Android w planach?
Na razie Eloquent jest dostępny wyłącznie na iOS. Co ciekawe, opis w App Store początkowo wspominał o wersji na Androida, ale Google później usunął te fragmenty. Dodano za to informację, że „klawiatura iOS nadchodzi wkrótce”.
Według usuniętego już opisu, wersja na Androida miała oferować możliwość ustawienia Eloquent jako domyślnej klawiatury systemowej. Miał też pojawić się pływający przycisk do szybkiego dostępu do transkrypcji z dowolnego miejsca w systemie – rozwiązanie podobne do tego, co oferuje Wispr Flow.
Rynek się zagęszcza
Google wchodzi na pole, gdzie konkurencja już istnieje i ma się dobrze. Wispr Flow, SuperWhisper, Willow – to tylko kilka nazw, które zdobyły już swoich użytkowników. Aplikacje do dyktowania oparte na AI stają się coraz popularniejsze, bo modele speech-to-text robią zauważalne postępy.
Eloquent jest aplikacją eksperymentalną. Jeśli test się powiedzie, możemy spodziewać się ulepszonej transkrypcji w całym ekosystemie Androida.
Na razie – aplikacja jest darmowa do pobrania. Model Gemma do ściągnięcia. I żadnych fanfar od Google.
