Google ogłosiło, że rozszerza funkcjonalność najnowszego trybu badawczego Gemini na 40 dodatkowych języków. To ważny krok w kierunku uczynienia narzędzia bardziej globalnym i dostępnym dla użytkowników na całym świecie.
Funkcja ta została udostępniona na początku grudnia w ramach płatnego planu Google One AI Premium, dając użytkownikom dostęp do zaawansowanego asystenta badawczego opartego na sztucznej inteligencji. Mechanizm działania trybu badawczego opiera się na kilku krokach. Najpierw narzędzie tworzy szczegółowy plan badawczy, następnie wyszukuje odpowiednie informacje, a na ich podstawie ponownie przeszukuje dane, aby wydobyć kluczową wiedzę. Po kilkukrotnym powtórzeniu tych etapów AI tworzy kompleksowy raport, który może być bardzo pomocny na potrzeby badań czy analiz.
Gemini obsługuje teraz takie języki jak: arabski, bengalski, chiński, duński, francuski, niemiecki, gudżarati, hindi, indonezyjski, włoski, japoński, kannada, koreański, malajalam, marathi, polski, portugalski, suahili, hiszpański, tamilski, telugu, thani, ukraiński i urdu. Poszerzenie obsługi języków to istotny krok dla użytkowników z różnych zakątków świata, którzy mogą teraz korzystać z narzędzia w swoim rodzimym języku.
Niemniej jednak, wyzwanie dla Google polega na zapewnieniu rzetelnych źródeł w poszczególnych językach oraz na poprawnym podsumowywaniu informacji w sposób zachowujący gramatykę i sens w każdym z nich. Jak zauważa HyunJeong Choe, dyrektor ds. inżynierii aplikacji Gemini, mimo że modele sztucznej inteligencji są trenowane na bazie czystych danych i wiarygodnych źródeł, obecnie istnieje ryzyko błędów w podsumowaniach, zwłaszcza w mniej popularnych językach, takich jak hindi.
„Z reguły polegamy na źródłach danych w oryginalnym języku i wykorzystujemy wyszukiwanie Google w tle, aby uzasadnić te informacje. Dodatkowo przeprowadzamy oceny i weryfikacje danych w natywnym języku, zanim udostępnimy model użytkownikom” – podkreśla Choe. „Prawdziwość danych oraz uzyskiwanie poprawnych informacji to znany problem badawczy związany z generatywną sztuczną inteligencją. Mimo że model już w trybie wstępnego treningu dysponuje ogromem danych, skupiamy się na szkoleniu go, aby wykorzystywał te dane w odpowiedni sposób” – dodaje dyrektor ds. inżynierii.
Jules Walter, lider produktu ds. rynków międzynarodowych aplikacji Gemini, wskazuje, że firma korzysta z programów testowych w celu zapewnienia oceny jakości z perspektywy użytkowników z różnych regionów. Dodatkowo Google generuje dane służące do trenowania modeli AI, a lokalne zespoły weryfikują te zestawy danych, aby lepiej dopasować je do specyfiki danego języka czy regionu.
Warto również wspomnieć, że firma w ostatnich tygodniach spotkała się z pewnymi kontrowersjami. Pojawiły się informacje o tym, że pracownicy zewnętrzni oceniający jakość odpowiedzi Gemini otrzymali wytyczne, aby nie pomijać ocen promptów, nawet jeśli wykraczały one poza ich kompetencje. W odpowiedzi rzecznicy Google podkreślili, że oceny obejmują nie tylko treść odpowiedzi, ale również styl, format i inne czynniki, które wpływają na jej ogólną jakość.
Rozwój Gemini, mimo wyzwań, wskazuje na dynamiczny postęp w dziedzinie sztucznej inteligencji, mający na celu tworzenie coraz bardziej użytecznych i dostępnych narzędzi dla użytkowników na całym świecie. Rozszerzenie obsługi języków to milowy krok w tym procesie i może przyczynić się do popularyzacji AI w jeszcze szerszych kręgach.