Nowy model sztucznej inteligencji firmy OpenAI, nazwany o3, osiągnął niesamowity wynik w prestiżowym teście ARC Challenge (Abstraction and Reasoning Corpus). To osiągnięcie, jak twierdzą niektórzy entuzjaści AI, może sugerować, że stoimy na progu stworzenia sztucznej inteligencji ogólnej (AGI) – systemu o inteligencji zbliżonej do ludzkiej. Niemniej jednak organizatorzy wyzwania ARC podkreślają, że choć o3 zrobiło ogromny krok naprzód, nie jest to jeszcze osiągnięcie AGI, a jedynie kolejny etap na drodze do osiągnięcia tego celu.
Co właściwie udało się osiągnąć modelowi o3?
ARC Challenge został stworzony w 2019 roku przez François Cholleta, inżyniera z Google, aby oceniać zdolność systemów sztucznej inteligencji do rozwiązywania logicznych wizualnych zagadek. Test polega na identyfikacji wzorców pomiędzy parami kolorowych siatek – wydaje się to proste dla ludzi, ale wymaga od AI zaawansowanego i elastycznego myślenia abstrakcyjnego. Aby uniemożliwić rozwiązanie zadania poprzez brutalną siłę obliczeniową, twórcy ograniczyli dopuszczalne koszty obliczeniowe każdego rozwiązania.
Model o3 uzyskał oficjalny wynik 75,7% na tzw. „półprywatnym” teście ARC, który znajduje się na publicznie dostępnym rankingu. Koszt obliczeniowy tego osiągnięcia wynosił około 20 dolarów na jedno zadanie, spełniając limit całkowitych kosztów ustalony na mniej niż 10 tysięcy dolarów. Niestety, o3 nie spełnił znacznie bardziej rygorystycznych wymagań prywatnego testu ARC – co oznaczało, że model nie zdobył głównej nagrody w wysokości 600 tysięcy dolarów.
W nieoficjalnym teście, gdzie ograniczenia obliczeniowe zostały zniesione, o3 osiągnął imponujący wynik 87,5%. Dla porównania, typowy wynik człowieka w ARC Challenge to 84%. Kluczowym problemem jest jednak koszt – przy takim podejściu koszty obliczeniowe rozwiązania jednego zadania sięgały tysięcy dolarów, co znacząco odbiega od założeń konkursu.
Czy sukces modelu o3 to przełom w kierunku AGI?
Pomimo imponującego wyniku, organizatorzy ARC Challenge jasno wskazują, że osiągnięcie przez OpenAI o3 nie oznacza jeszcze stworzenia AGI. François Chollet oraz inni badacze, jak Melanie Mitchell z Santa Fe Institute, są zdania, że obecny model w dużej mierze opiera się na dużej mocy obliczeniowej i nadal nie może sobie poradzić z wieloma stosunkowo prostymi zadaniami, które są intuicyjne dla ludzi.
Chollet zauważa, że stworzenie AGI będzie oznaczać moment, w którym przestanie być możliwe opracowanie zadań, które człowiek rozwiązuje bez trudu, a które są niemożliwe do rozwiązania dla AI. Dodatkowo, Thomas Dietterich z Uniwersytetu Stanowego Oregonu uważa, że do osiągnięcia AGI brakuje wielu kluczowych komponentów ludzkiego myślenia, takich jak pamięć epizodyczna, zdolność do planowania, logiki czy metapoznanie – zdolności do myślenia o własnym procesie myślenia.
Warto również wspomnieć o kosztach obliczeniowych. Jeśli AI wymaga ogromnych zasobów, aby osiągnąć wyniki zbliżone do ludzkich, czy naprawdę możemy mówić o znacznym kroku na drodze do AGI? Wielu ekspertów uważa, że odpowiedź na to pytanie poznamy dopiero wtedy, gdy pojawią się otwarcie dostępne repliki tego modelu do dalszych badań i testów.
Co oznacza sukces modelu o3 dla przyszłości sztucznej inteligencji?
Osiągnięcie modelu o3 pokazuje, że przemysł technologiczny nadal przesuwa granice tego, co można zrobić z AI, pomimo spowolnienia tempa postępów w 2024 roku w porównaniu do przełomowych wydarzeń z roku 2023. Nie jest wykluczone, że AI w najbliższej przyszłości rzeczywiście przekroczy próg 85% wymagany dla głównej nagrody ARC Challenge. Kilka modeli już teraz osiąga wyniki powyżej 81% w oficjalnych testach.
Dodatkowo organizatorzy konkursu ARC planują wprowadzenie nowego zestawu jeszcze trudniejszych zadań w 2025 roku, tworząc kolejny poziom wyzwań, który pomoże ocenić, czy modele AI będą mogły się zbliżyć jeszcze bardziej do ludzkiego myślenia. Jedno jest pewne – choć AI o3 nie osiągnął AGI, to jego sukces jest istotnym krokiem na drodze ku dalszym badaniom i rozwojowi sztucznej inteligencji.