Google systematycznie rozwija swoją sztuczną inteligencję Gemini, wprowadzając funkcje, które coraz bardziej przybliżają ją do konkurencyjnych rozwiązań takich jak ChatGPT. Choć do niedawna użytkownicy Gemini Advanced mogli przesyłać tylko jedno zdjęcie do analizy w ramach jednego zapytania, najnowsze zmiany przynoszą powiew świeżości – wybrani użytkownicy zyskali już możliwość przesyłania kilku obrazów jednocześnie za pomocą modelu Gemini 2.0 Flash. To długo wyczekiwana funkcja, szczególnie przez tych, którzy w swojej pracy lub pasji opierają się na analizie wizualnej danych w kontekście generatywnej AI.
Według zgłoszeń zamieszczonych m.in. na platformie Reddit, użytkownik o pseudonimie Gaiden206 potwierdził dostęp do tej nowej funkcjonalności w wersji webowej Gemini Advanced. Wspierany przez model Flash 2.0 system pozwala teraz na dodanie wielu zdjęć w jednym zapytaniu, co znacząco zwiększa możliwości analityczne i kreatywne użytkowników. Taka zmiana to odpowiedź na dotychczasową przewagę ChatGPT, który funkcję tę udostępniał od dawna.
Niestety, nie wszystko działa jeszcze idealnie. Wśród pierwszych użytkowników pojawiają się głosy, że jakość wynikowych obrazów generowanych przez AI po analizie przesłanych zdjęć pozostawia wiele do życzenia. Obrazy mogą być zniekształcone lub prezentować nieoczekiwane rezultaty, co może zniechęcić do tej funkcji bardziej wymagających użytkowników. Warto zaznaczyć, że funkcja multi-image upload najprawdopodobniej jest dostępna jedynie dla posiadaczy kont płatnych – choć nawet nie wszyscy z nich mają jeszcze do niej dostęp, co potwierdza, że wprowadzanie tej opcji odbywa się stopniowo i może potrwać kilka tygodni.
To nie koniec nowości wokół Gemini. Google poinformowało również o rozszerzaniu możliwości edytowania obrazów – zarówno tych wygenerowanych przez sztuczną inteligencję, jak i przesłanych przez użytkowników. Funkcja edycji dostępna jest już na wybranych rynkach zarówno w aplikacji mobilnej, jak i na platformie webowej. Pozwala na zmianę tła zdjęcia, dodawanie lub usuwanie elementów, a także bardziej zaawansowaną manipulację obiektami na obrazie. Co istotne, nowość obsługuje ponad 45 języków, co świadczy o globalnym zasięgu aktualizacji i aspiracjach Google, by uczynić Gemini jeszcze bardziej uniwersalnym narzędziem dla użytkowników na całym świecie.
Umożliwienie przesyłania wielu obrazów oraz edycji za pomocą AI to istotny krok w kierunku uzupełnienia funkcjonalności Gemini względem konkurencji. Choć aktualnie opcja ta nie jest dostępna dla wszystkich, można spodziewać się, że w nadchodzących tygodniach zostanie udostępniona szerzej. Jeżeli w przyszłości Google zdoła poprawić jakość generowanych wyników i zapewni stabilność działania funkcji, Gemini może stać się głównym wyborem dla osób pracujących na danych wizualnych – grafików, projektantów, marketerów czy nauczycieli wykorzystujących multimedia w nauczaniu.
Warto śledzić rozwój tej funkcji i sprawdzać, czy nasz dostęp do niej został już aktywowany. To może być początek nowej ery w wykorzystaniu AI do analizy i edycji obrazów – bardziej zaawansowanej, bardziej intuicyjnej i otwartej na kreatywność użytkownika.