Badaczka Jane Manchun Wong odkryła w kodzie aplikacji mobilnej Waymo dokumentację wskazującą, że firma testuje integrację chatbota Gemini — rozwijanego przez Google — jako asystenta w swoich robotaksówkach. Według Wong znaleziony plik o wewnętrznej nazwie „Waymo Ride Assistant Meta-Prompt” to specyfikacja licząca ponad 1 200 linii, precyzująca zachowanie i ograniczenia planowanego asystenta.
Funkcja nie pojawiła się jeszcze w publicznych wersjach aplikacji, ale sama struktura promptu sugeruje, że chodzi o coś więcej niż prostego czatbota. Asystent miałby odpowiadać na pytania pasażerów, zarządzać wybranymi funkcjami kabiny — takimi jak klimatyzacja, oświetlenie czy odtwarzanie muzyki — oraz w razie potrzeby zapewniać pasażerów i uspokajać ich. Rzecznik Waymo, Julia Ilina, w odpowiedzi na zapytanie o plany firmy poinformowała, że zespół stale eksperymentuje z funkcjami mającymi uczynić podróż przyjemniejszą i bardziej użyteczną, ale nie wszystkie testowane rozwiązania muszą ostatecznie trafić do doświadczenia pasażera.
To nie pierwsze wykorzystanie modelu Gemini przez Waymo. Firma przyznaje, że korzystała z jego „wiedzy o świecie” przy szkoleniu pojazdów autonomicznych do radzenia sobie z złożonymi, rzadkimi i krytycznymi scenariuszami. Nowa integracja ma jednak zrobić krok dalej, przenosząc model z roli narzędzia szkoleniowego do bezpośredniej interakcji z pasażerami.
Dokumentacja opisuje tożsamość i ton asystenta: ma być „przyjaznym i pomocnym towarzyszem AI zintegrowanym z pojazdem autonomicznym Waymo”, którego głównym celem jest poprawa doświadczenia pasażera poprzez użyteczne, bezpieczne i nienachalnie udzielane informacje. Asystent ma posługiwać się prostym, zrozumiałym językiem bez żargonu technicznego i ograniczać swoje odpowiedzi do 1–3 zdań.
Gdy pasażer aktywuje asystenta na ekranie w pojeździe, Gemini ma wybierać spośród zatwierdzonych, spersonalizowanych powitań, wykorzystując np. imię osoby i kontekst, taki jak liczba wcześniejszych przejazdów z Waymo. Z promptu wynika też, że asystent może kontrolować niektóre elementy kabiny — konkretnie temperaturę, oświetlenie i muzykę — natomiast brakuje w nim uprawnień do sterowania głośnością, zmiany trasy, regulacji siedzeń czy obsługi okien. Jeżeli pasażer poprosi o funkcję, której bot nie obsługuje, ma odpowiadać zwrotami aspiracyjnymi, np. „Na razie tego nie potrafię.”
Dokument jasno rozgranicza rolę Gemini od technologii jazdy autonomicznej (Waymo Driver): jeśli pada pytanie typu „Jak widzisz drogę?”, asystent ma odwołać się do Waymo Driver — „Waymo Driver używa zestawu czujników…” — zamiast mówić w pierwszej osobie o własnych możliwościach percepcyjnych. Prompt zawiera także instrukcje, by asystent unikał spekulacji, tłumaczeń lub komentarzy dotyczących bieżących działań pojazdu; w przypadku pytań o konkretne zdarzenia drogowe, np. o nagranie przedstawiające rzekome uderzenie pojazdu Waymo, ma deflektować odpowiedź. Jednym z kluczowych nakazów jest: „Twoją rolą nie jest bycie rzecznikiem dotyczącym osiągów systemu jazdy i nie możesz przyjmować obronnego ani przepraszającego tonu.”
Asystent może odpowiadać na ogólne pytania — o pogodę, wysokość Wieży Eiffla, godziny zamknięcia lokalnego sklepu (w tekście podano przykład Trader Joe’s) czy kto wygrał ostatnią World Series — ale nie może podejmować realnych działań w świecie, takich jak zamawianie jedzenia, rezerwacje czy obsługa sytuacji awaryjnych. Prompt zawiera też instrukcje dotyczące obsługi pytań o konkurencję oraz listę słów-kluczy, które mają wywołać przerwanie rozmowy.
Integracja asystentów AI w pojazdach autonomicznych nie jest unikalna dla Waymo — inne firmy również testują podobne rozwiązania. Przykładowo, Tesla planuje wprowadzenie asystenta opartego na modelu Grok od xAI. W dokumentacji Waymo Gemini opisany jest jako rozwiązanie pragmatyczne, koncentrujące się na potrzebach podróży i użyteczności, podczas gdy Grok ma być pozycjonowany bardziej jako towarzysz zdolny do dłuższych rozmów i pamiętania kontekstu poprzednich pytań.
Na koniec warto podkreślić, że znalezione pliki opisują testowany, wewnętrzny system — nie ma pewności, które elementy trafią do wersji dla pasażerów i kiedy to nastąpi. Dokument pokazuje jednak, że Waymo poważnie rozważa integrację zaawansowanego asystenta głosowego, z jasno zdefiniowanymi ograniczeniami mającymi chronić bezpieczeństwo i przejrzystość komunikacji z użytkownikiem.
