Przełomowy moment dla sztucznej inteligencji Google — Gemini 2.5 Pro właśnie ukończył kultową grę Pokémon Blue, wydaną pierwotnie w 1996 roku. To wyjątkowe osiągnięcie podkreśla rosnącą sprawność modeli językowych w złożonych i nieoczywistych zadaniach.
Trudno w to uwierzyć, ale za sukcesem AI nie stoi zespół inżynierów z Doliny Krzemowej, lecz entuzjasta i niezależny twórca, znany jako Joel Z — 30-letni programista, który stworzył transmisję „Gemini Plays Pokémon” na platformie Twitch. Choć nie jest formalnie związany z Google, jego projekt zdobył uznanie najwyższych rangą przedstawicieli firmy, w tym samego CEO, Sundara Pichai, który z entuzjazmem ogłosił na platformie X: „Co za finał! Gemini 2.5 Pro właśnie ukończył Pokémon Blue!”.
Nie tylko Sundar Pichai dopingował AI w tej nietypowej potyczce. Logan Kilpatrick, szef produktu Google AI Studio, już wcześniej informował o postępach AI w grze, chwaląc się zdobyciem przez model piątej z ośmiu odznak trenerskich. Dla porównania, inne modele językowe, takie jak Claude od Anthropic, zatrzymały się na trzeciej – co dodatkowo napędziło rywalizację pomiędzy zespołami rozwijającymi sztuczną inteligencję.
Wybór Pokémon Blue jako pola testowego nie był przypadkowy. Scena AI od jakiegoś czasu przygląda się grom retro jako narzędziom do testowania zdolności rozumowania oraz planowania długoterminowego przez sztuczne modele. Te elementy wymagają nie tylko znajomości zasad gry, ale również zdolności analizowania otoczenia, podejmowania trafnych decyzji i reagowania na nieprzewidywalne sytuacje — co idealnie odpowiada badaniom nad tzw. „rozszerzonym myśleniem” w kontekście modeli sztucznej inteligencji.
Warto jednak zaznaczyć, że AI nie grało w grę zupełnie samodzielnie. Kluczową rolę odegrały tu tzw. „agent harnesses” — narzędzia dostarczające modelowi zrzuty ekranu z gry wzbogacone o dodatkowe informacje kontekstowe. Dzięki nim Gemini mógł lepiej analizować sytuację i podejmować decyzje, takie jak wybieranie odpowiednich komend czy interakcja z otoczeniem gry. To właśnie te narzędzia umożliwiają AI funkcjonowanie w środowisku tak złożonym, jak świat Pokémon.
Choć Claude, konkurencyjny model opracowany przez firmę Anthropic, również mierzy się z Pokémon Red (siostrzaną wersją Pokémon Blue), nie udało mu się jeszcze ukończyć gry. Nie oznacza to jednak, że Gemini jest jednoznacznie „lepsze”. Sam Joel Z uczula widzów swojego kanału Twitch, aby nie traktowali tego wyczynu jako jednoznacznego miernika efektywności modeli LLM (large language models) w grach komputerowych. Jak podkreśla, oba modele korzystają z zupełnie innych zestawów narzędzi i otrzymują różne dane wejściowe, co uniemożliwia bezpośrednie porównanie wyników.
Co więcej, twórca projektu przyznaje, że niektóre „interwencje deweloperskie” miały na celu poprawę działania modelu w trudniejszych momentach gry. Jak mówi, „nie korzystam z gotowych poradników czy instrukcji. Nie podsuwam też konkretnych odpowiedzi. Najbliżej czegokolwiek, co można by nazwać pomocą, było poinformowanie Gemini o konieczności dwukrotnej rozmowy z człowiekiem z zespołu Rocket, aby zdobyć Klucz Windy – to znany błąd, który naprawiono później w Pokémon Yellow”.
Obecnie projekt „Gemini Plays Pokémon” nadal się rozwija. Joel Z regularnie udoskonala jego mechanizmy, dzięki czemu AI staje się coraz lepsza w przewidywaniu rezultatów, rozwiązywaniu zadań logicznych oraz planowaniu kroków na wiele etapów naprzód. Sukces ten nie tylko bawi i inspiruje fanów gier wideo, ale również jest interesującym przykładem potencjału nowoczesnych modeli AI do działania w dynamicznych, nieliniowych środowiskach.
Chociaż przejście przez Pokémon Blue w wykonaniu sztucznej inteligencji może wydawać się zabawnym eksperymentem, ma głębsze znaczenie — pokazuje bowiem, jak blisko jesteśmy tworzenia systemów, które potrafią uczyć się i myśleć w sposób coraz bardziej zbliżony do człowieka. To ekscytująca perspektywa dla przyszłości nie tylko w świecie gier, ale i zaawansowanych aplikacji AI.