Google zaprezentował kolejną aktualizację swojego flagowego modelu sztucznej inteligencji – Gemini 2.5, która znacząco poszerza dotychczasowe możliwości narzędzia. Choć nie mówimy jeszcze o wersji Gemini 3.0, to zmiany wprowadzone w wersji 2.5 wskazują na ewolucję w kierunku jeszcze bardziej zaawansowanej AI. Wśród najważniejszych nowości znalazł się tryb „Deep Think” oraz ekskluzywny plan subskrypcyjny Ultra, wyceniony na 249 dolarów miesięcznie. To znacznie więcej niż obecna oferta konkurencji, w tym OpenAI, ale Google zapewnia, że wyższy koszt idzie w parze z rewolucyjną funkcjonalnością.
Nowo ogłoszony tryb „Deep Think” to krok milowy w zakresie analizy danych i rozumowania wieloetapowego. Pozwala on modelowi Gemini testować liczne hipotezy przed udzieleniem odpowiedzi, co znacząco zwiększa precyzję odpowiedzi w zadaniach związanych z matematyką, kodowaniem oraz skomplikowanymi analizami logicznymi. Ta funkcjonalność stawia Geminiego 2.5 Pro na czele najnowszych standardów branżowych. Niestety, tryb ten nie jest jeszcze ogólnie dostępny – początkowo trafi jedynie do ograniczonego grona testerów poprzez Gemini API. Planowane jest również wprowadzenie opcji „budżetu myślenia”, pozwalającej deweloperom ograniczyć ilość tokenów wykorzystywanych przez model podczas generowania złożonych odpowiedzi.
Ekskluzywny plan Ultra to nie tylko dostęp do trybu “Deep Think”. Pakiet ten obejmuje również wcześniejszy dostęp do funkcji Gemini w przeglądarce Chrome, podwyższone limity korzystania z narzędzi AI (takich jak NotebookLM czy system do generowania filmów – Flow) oraz wsparcie dla użytkowników Premium YouTube i aż 30 TB przestrzeni dyskowej w chmurze. Tego typu pakiet jest skierowany głównie do firm, twórców treści oraz użytkowników, którzy wykorzystują AI w zaawansowany, produkcyjny sposób.
Google nie zapomina jednak o szybkości działania swoich rozwiązań. Firma zaprezentowała nowy model dyfuzyjny Gemini, który przenosi technologię wykorzystywaną do generowania obrazów na grunt przetwarzania tekstu. Matematyczne rozwiązania przedstawiane były podczas prezentacji z imponującą prędkością – poniżej jednej sekundy. Co więcej, nowy model stosuje metodę „iteracyjnego przetwarzania”, w której wraca do wcześniejszych fragmentów treści, aby dopracować wynik. To podejście niesie ze sobą zupełnie nową jakość w generowaniu tekstów wymagających większego skupienia i analizy logicznej.
Kolejną innowacją, która wzbudziła duże zainteresowanie, jest rozwój tzw. agentów komputerowych, a przede wszystkim inicjatywa o nazwie Project Mariner. To narzędzie przeznaczone do zautomatyzowanego korzystania z przeglądarki, które może wykonywać wiele zadań jednocześnie – od wyszukiwania informacji, przez rezerwowanie miejsc w restauracjach, aż po robienie zakupów w imieniu użytkownika. To kolejne potwierdzenie, że Google stawia na tzw. „agentowe AI”, które potrafi działać w imieniu człowieka i zarządzać wieloma aspektami cyfrowego życia.
Funkcjonalności Project Mariner znajdą także zastosowanie w wyszukiwarce Google, w ramach trybu „AI Mode”. Do tej pory oferowany jako eksperyment, teraz zostaje udostępniony dla szerokiej publiczności w USA. Dzięki integracji z agentem AI, użytkownicy mogą szybciej znaleźć informacje, wykonać rezerwacje czy dokonać zakupów. Co istotne, AI Mode będzie także dostarczać spersonalizowane rekomendacje, bazując na danych z Gmaila i innych usług Google – oczywiście po wcześniejszym wyrażeniu zgody przez użytkownika.
Zapowiedzi te jednoznacznie pokazują, że Google nie tyle podąża za trendami, co stara się je wyznaczać. W erze dynamicznego rozwoju modeli językowych i agentów AI, korporacja z Mountain View stawia na głębię analizy, kompleksowość zastosowań i szybkość działania. Choć dostęp do najnowszych funkcji będzie początkowo mocno ograniczony lub kosztowny, to bez wątpienia kierunek, jaki obiera Google, ma potencjał, by zdefiniować kolejną dekadę rozwoju sztucznej inteligencji.