Google rozwija funkcje swojego modelu sztucznej inteligencji Gemini, które coraz mocniej integrują się z ekosystemem Androida. Od zastąpienia Google Assistant, przez obecność w Android Auto, aż po planowane nowe możliwości obsługi wideo – technologia ta stale zyskuje na funkcjonalności. Najnowsze odkrycia wskazują, że Google pracuje nad możliwością przesyłania plików wideo bezpośrednio do Gemini w celu ich analizy.
Nowa funkcja analizy wideo w Gemini
Obecnie Gemini potrafi już analizować strony internetowe, obrazy, dokumenty PDF, a także filmy na YouTube – pod warunkiem podania odpowiedniego linku. Dotąd nie było jednak opcji bezpośredniego przesyłania plików wideo do analizy. Najnowsze informacje sugerują, że Google planuje wdrożenie takiej funkcjonalności, co może istotnie rozszerzyć zakres możliwości sztucznej inteligencji Gemini.
Zespół testujący beta-wersję aplikacji Google (16.9.39.sa.arm64) odkrył odniesienia do przesyłania wideo w interfejsie czatu Gemini. Ukryte w kodzie aplikacji ciągi znaków sugerują, że użytkownicy będą mogli dodawać filmy do rozmowy, widzieć czas trwania pliku oraz uruchamiać przesłany materiał bezpośrednio w aplikacji.
Co mówią testy?
Na ten moment interfejs Gemini w systemie Android nie pozwala na bezpośrednie przesyłanie wideo, a próba wyboru pliku z menedżera plików nie jest możliwa. Mimo to, podczas testów udało się dodać materiał wideo do rozmowy z modelem. Niestety, system nie był jeszcze w stanie go przeanalizować – najprawdopodobniej funkcja nie została jeszcze w pełni wdrożona lub obecna wersja modelu AI nie obsługuje tej opcji.
Na dostępnych zrzutach ekranu widać, że przesyłane wideo pojawia się w oknie rozmowy z oznaczeniem czasu trwania oraz przyciskiem odtwarzania. Niemniej jednak na chwilę obecną odtworzenie pliku nie jest funkcjonalne. Nie wiadomo również, czy Google planuje nałożyć ograniczenia dotyczące długości czy maksymalnego rozmiaru przesyłanych plików.
Jakie korzyści przyniesie ta nowość?
Możliwość przesyłania wideo do Gemini otwiera wiele potencjalnych zastosowań. Przykładowo, użytkownicy mogliby wgrać nagranie z wykładu i uzyskać jego podsumowanie, przeanalizować materiał z kamer monitoringu pod kątem konkretnych momentów, a nawet poprosić AI o ocenę swoich treści na mediach społecznościowych. Dodatkowo taka funkcja mogłaby usprawnić diagnostykę problemów technicznych – zamiast żmudnego opisywania problemu, wystarczyłoby przesłać nagranie ekranu, a Gemini mogłoby pomóc w rozwiązaniu problemu.
Kiedy można spodziewać się tej funkcji?
Dokładna data wdrożenia funkcji przesyłania wideo do Gemini pozostaje nieznana, choć Google regularnie aktualizuje i rozwija swoje modele AI. Biorąc pod uwagę tempo, w jakim firma wprowadza nowe możliwości, można przypuszczać, że wsparcie dla analizy wideo pojawi się stosunkowo szybko. Wciąż otwartą kwestią pozostaje także to, czy funkcja będzie dostępna dla wszystkich użytkowników, czy też trafi jedynie do subskrybentów wersji Gemini Advanced.
Rozszerzenie Gemini o analizę wideo to kolejny krok Google w kierunku uczynienia tej sztucznej inteligencji jeszcze bardziej wszechstronną. Jeśli firma skutecznie wdroży tę funkcję, użytkownicy zyskają narzędzie o znacznie większym potencjale niż dotychczas.