Google oficjalnie ogłosiło nową funkcję w swojej aplikacji Gemini – edycję obrazów, zarówno tych generowanych przez sztuczną inteligencję, jak i przesyłanych przez użytkowników z urządzeń mobilnych czy komputerów. Ta długo wyczekiwana funkcjonalność zaczyna być stopniowo wdrażana już od dziś. Użytkownicy na całym świecie – w ponad 45 językach – będą mogli skorzystać z tych możliwości w nadchodzących tygodniach.
Nowa funkcja edytowania obrazów to kontynuacja wcześniejszych eksperymentów z narzędziami AI w ramach platformy AI Studio. Systemy te wzbudziły duże zainteresowanie w marcu tego roku, m.in. za sprawą kontrowersyjnej opcji usuwania znaków wodnych z dowolnych obrazów. Teraz jednak Google oferuje bardziej rozbudowane narzędzia do edycji, które mają przewyższać jakością efekty uzyskiwane przez tradycyjne generatory graficzne oparte na sztucznej inteligencji.
Nowy edytor obrazów w Gemini to coś więcej niż tylko proste poprawki. Google wprowadza tzw. wieloetapowy proces edycji, który pozwala użytkownikom dodawać elementy, zmieniać tło, usuwać lub zamieniać obiekty oraz komponować zupełnie nowe kompozycje graficzne – wszystko w trakcie jednej interakcji z chatbotem. Dzięki integracji tekstu i obrazu, odpowiedzi Gemini stają się „bogatsze i bardziej kontekstowe”, jak podkreśla Google.
Jednym z przykładów zastosowania narzędzia jest możliwość przesłania własnego zdjęcia i poproszenia Gemini, aby pokazało nas z innym kolorem włosów. Możliwości są jednak znacznie szersze – użytkownik może także stworzyć historię na dobranoc z udziałem smoków, a chatbot automatycznie wygeneruje nie tylko tekst, ale i dopasowane do jego treści ilustracje. Dzięki temu Gemini staje się unikalnym narzędziem zarówno do zabawy, jak i bardziej profesjonalnych zastosowań graficznych.
Nie zabrakło jednak również zastrzeżeń. Google przyznaje, że możliwość edytowania zdjęć i generowania realistycznych obrazów to potencjalne ryzyko tworzenia tzw. deepfake’ów. Firma zapewnia, że wszystkie obrazy tworzone lub edytowane za pomocą Gemini będą zawierały niewidoczny znak wodny, co ma wspomóc ich identyfikację w przyszłości. Co więcej, Google testuje obecnie także wdrażanie widocznych znaków wodnych, które dodatkowo zwiększyłyby transparentność i autentyczność publikowanych obrazów.
Wprowadzenie edycji obrazów zasługuje na uwagę jako kolejny krok w ewolucji sztucznej inteligencji dostępnej dla każdego użytkownika. Gemini nie tylko rozszerza swoje możliwości, ale także zmienia sposób, w jaki ludzie będą wchodzić w interakcję z obrazem i tekstem. Dla twórców, artystów, marketerów i codziennych użytkowników, ta technologia oznacza oszczędność czasu oraz większą swobodę twórczą niż kiedykolwiek wcześniej. Wszystko to w zintegrowanym środowisku, które łączy potęgę języka z obrazem – bez potrzeby korzystania z zewnętrznych edytorów graficznych.