Luty był dla Google miesiącem wyjątkowo napiętym. Firma wypuściła nowe wersje modeli Gemini, ogłosiła partnerstwa na AI Impact Summit w Indiach i pokazała, jak sztuczna inteligencja wspiera sportowców na zimowych igrzyskach olimpijskich.
AI Impact Summit w Nowym Delhi
Google zebrało się z liderami ze świata polityki, biznesu i nauki w Nowym Delhi, by zademonstrować, w jaki sposób AI przekłada się na realne rozwiązania problemów społecznych. Sundar Pichai, CEO Google, wygłosił przemówienie otwierające, w którym stwierdził, że żadna technologia nie rozbudza w nim większych ambicji niż AI. Wezwał jednocześnie do odpowiedzialnego i odważnego podejścia do jej wdrażania.
W ramach szczytu ogłoszono nowe programy Google.org Impact Challenges wspierające badania naukowe i projekty rządowe, a także partnerstwa z instytucjami w Indiach ukierunkowane na edukację i skalowanie rozwiązań AI.
Gemini 3.1 Pro i odświeżony Deep Think
Największą techniczną premierą lutego jest Gemini 3.1 Pro. Google chwali się, że model osiąga ponad dwukrotnie lepsze wyniki w rozumowaniu w porównaniu do poprzedniej wersji 3 Pro. Model jest dostępny dla deweloperów, przedsiębiorstw oraz użytkowników indywidualnych na różnych platformach.
Równolegle ukazała się aktualizacja Gemini 3 Deep Think, opracowana we współpracy z naukowcami i inżynierami. Wersja ta jest przeznaczona do pracy z niejednoznacznymi, technicznymi danymi, gdzie proste odpowiedzi „tak/nie” nie wystarczą. Deep Think dostępny jest w aplikacji Gemini dla subskrybentów Google AI Ultra, a zainteresowani dostępem przez Gemini API mogą zapisywać się na listę oczekujących.
Piotr Wolniewicz, Redaktor Naczelny AIPORT.pl: Tempem premier modeli zaczyna kręcić się w głowie. Gemini 3.1 Pro i usprawniony Deep Think brzmią obiecująco, szczególnie jeśli chodzi o zastosowania naukowe i techniczne. Tylko że użytkownicy zaczynają już mieć trudność z orientowaniem się, który model jest najlepszy do czego, które funkcje dostępne są w jakim planie i na jakiej platformie. Plusem jest rosnąca moc obliczeniowa dostępna „z pudełka”. Minusem? Coraz bardziej zamknięte ekosystemy i subskrypcyjne bramy dostępu do najlepszych możliwości. Warto pytać: kto tak naprawdę skorzysta na tych postępach?
Nano Banana 2 i generowanie obrazów
Google wypuściło Nano Banana 2, nowy model generowania obrazów, który łączy jakość modeli z klasy Pro z szybkością modeli Flash. Ulepszone generowanie obrazów trafia do aplikacji Gemini i Google Search. Deweloperzy już teraz mogą budować na jego podstawie własne aplikacje.
Lyria 3 i muzyka generatywna
Luty przyniósł też narzędzia dla twórców muzyki:
- Lyria 3 w aplikacji Gemini pozwala generować 30-sekundowe utwory muzyczne z okładką na podstawie opisu tekstowego, zdjęcia lub wideo.
- Google udostępniło sześć wskazówek dotyczących promptowania Lyria 3.
- ProducerAI dołącza do Google Labs jako asystent tworzenia muzyki, pomagający rozwijać teksty i melodie.
Flow, czyli jedno miejsce do tworzenia treści
Zaktualizowano też narzędzie Flow w Google Labs. Platforma umożliwia generowanie, edycję i animowanie obrazów oraz wideo w jednym miejscu, z nowym interfejsem ułatwiającym zarządzanie zasobami. Google pozycjonuje Flow jako kompleksowe środowisko dla twórców pracujących z AI.
AI na olimpijskich stokach
Jednym z bardziej niespodziewanych zastosowań AI opisanych przez Google było wsparcie olimpijczyków ze Stanów Zjednoczonych. Google Cloud i Google DeepMind zbudowały narzędzie do analizy wideo, które na podstawie zwykłego materiału 2D mapuje ruchy zawodnika, uwzględniając nawet bulwiaste zimowe kombinezony. Analiza zajmuje kilka minut, co pozwala sportowcom i trenerom na niemal natychmiastowe korekty.
To ciekawy przykład tego, jak AI przestaje być abstrakcją i zaczyna konkretnie wpływać na wyniki sportowe. Choć pewnie nieprędko zobaczymy takie narzędzia dostępne poza elitarnym sportem wyczynowym.
Bezpieczeństwo cyfrowe w czasach AI
Na 62. Monachijskiej Konferencji Bezpieczeństwa Kent Walker, Prezes ds. Globalnych Google, przekonywał do współpracy w kwestii cyberbezpieczeństwa w erze AI. Stwierdził, że stare metody odpierania zagrożeń przestają działać i wezwał do budowania odporności cyfrowej bez rezygnowania z kontroli nad własnymi danymi.
Gemini wygrał rankingiem reklam Super Bowl
Na marginesie: reklama Gemini emitowana podczas Super Bowl, pokazująca matkę i syna urządzających nowy dom przy pomocy AI, zdobyła pierwsze miejsce w corocznym rankingu najlepszych reklam Kellogg School. To drobny, ale symptomatyczny sygnał, że Google zaczyna coraz skuteczniej komunikować AI konsumentom jako coś bliskiego i użytecznego, a nie tylko techniczną ciekawostkę dla programistów.
