Czy dzisiejsze modele sztucznej inteligencji (AI) naprawdę pamiętają, myślą, planują i rozumują tak, jak to robi ludzki mózg? Niektóre laboratoria AI mogą próbować nas o tym przekonać, ale według głównego naukowca AI w Meta, Yanna LeCuna, odpowiedź brzmi: nie. Jednak LeCun wierzy, że w ciągu dziesięciu lat możemy się zbliżyć do tego celu, dążąc do nowej metody zwanej „modelem świata.”
Czy AI osiągnie poziom ludzkiego myślenia?
Wcześniej w tym roku OpenAI wprowadziło funkcję „pamięci” dla ChatGPT, która umożliwia temu modelowi zapamiętywanie rozmów użytkownika. Z kolei nowe modele generacji o1 od OpenAI wyświetlają nawet słowo „myślenie” podczas generowania odpowiedzi, a firma twierdzi, że są one również zdolne do „złożonego rozumowania”. Wszystko to może sugerować, że zbliżamy się do osiągnięcia ogólnej sztucznej inteligencji (AGI), czyli AI o poziomie inteligencji zbliżonym do ludzkiego.
Jednak podczas niedawnego wystąpienia na forum Hudson, LeCun ostudził te entuzjastyczne wizje, wyrażane m.in. przez Elona Muska (założyciela xAI) i Shane’a Legga (współzałożyciela Google DeepMind). Obaj sugerowali, że AGI jest tuż za rogiem. „Potrzebujemy maszyn, które rozumieją świat, które mogą zapamiętywać, mają intuicję, zdrowy rozsądek, a także zdolność rozumowania i planowania na poziomie człowieka” – wyjaśnił LeCun. „Obecne systemy AI nie są w stanie tego osiągnąć, mimo tego, co mogą mówić niektórzy entuzjaści.”
Limitacje obecnych modeli AI
LeCun zaznacza, że dzisiejsze duże modele językowe (LLM), takie jak te, które zasilają ChatGPT i Meta AI, są dalekie od osiągnięcia poziomu inteligencji ludzkiej. Według niego, może minąć jeszcze wiele lat, a nawet dekad, zanim ludzka inteligencja zostanie osiągnięta przez AI. Jednym z powodów jest to, że obecne LLM działają na zasadzie przewidywania kolejnych tokenów – zazwyczaj kilku liter lub krótkiego słowa. Z kolei modele AI do przetwarzania obrazów i wideo przewidują kolejne piksele, co czyni te modele predykcyjnymi, lecz ograniczonymi do swoich wymiarów.
Mimo postępów w przetwarzaniu języka i obrazów, sztuczna inteligencja nie jest w stanie zrozumieć trójwymiarowego świata w sposób, w jaki robi to ludzki mózg. Przykład? Ludzie uczą się prostych zadań, takich jak sprzątanie stołu czy prowadzenie samochodu, bardzo szybko – często w ciągu kilku godzin. Tymczasem nawet najbardziej zaawansowane systemy AI, które opierają się na tysiącach lub milionach godzin danych, nie są w stanie niezawodnie funkcjonować w fizycznym świecie.
Co to jest „model świata”?
Aby przezwyciężyć te ograniczenia, LeCun proponuje budowanie trójwymiarowych modeli świata, które mogą postrzegać otaczającą nas rzeczywistość. Wszystko to miałoby być oparte na nowej architekturze AI, zwanej „modelem świata”. Jak wyjaśnia LeCun, „model świata to twoja mentalna reprezentacja tego, jak działa świat. Możesz wyobrazić sobie sekwencję działań, które podejmiesz, a model świata przewidzi, jaki wpływ te działania będą miały na rzeczywistość.”
Wyobraźmy sobie na przykład bałagan w sypialni. Bez konieczności testowania różnych metod sprzątania, nasz mózg natychmiast tworzy plan działania: podnieś ubrania, odłóż je na miejsce, a pokój stanie się czysty. To właśnie ten proces planowania działań, oparty na rozumieniu przestrzeni, jest kluczowym elementem, który modele świata mogą wprowadzić do sztucznej inteligencji.
Modele świata – przyszłość AI?
Jedną z zalet modeli świata jest to, że mogą one przetwarzać znacznie więcej danych niż klasyczne LLM. Jednak to również czyni je bardziej obciążającymi obliczeniowo, co wyjaśnia, dlaczego dostawcy usług w chmurze rywalizują o partnerstwa z firmami zajmującymi się sztuczną inteligencją. Modele świata stały się nowym gorącym tematem w świecie AI, a wiele startupów, takich jak World Labs, przyciąga spore inwestycje. Na przykład, zespół World Labs, w skład którego wchodzą uznani badacze AI, zebrał niedawno 230 milionów dolarów finansowania, aby przekształcić koncepcję modeli świata w rzeczywistość.
LeCun zauważa, że idea modeli świata nie jest nowa – istnieje od ponad 60 lat. W 2022 roku opublikował on artykuł opisujący, jak można wykorzystać modele świata do stworzenia AI na poziomie ludzkim. W skrócie, model świata mógłby analizować aktualny stan rzeczy – na przykład nagranie wideo z brudnym pokojem – a następnie przewidywać, jak zmiany wprowadzone przez AI wpłyną na rzeczywistość. Następnie model otrzymuje określony cel, taki jak posprzątanie pokoju, i instrukcje, jak go osiągnąć, jednocześnie unikając szkody dla ludzi.
Czy modele świata zrewolucjonizują sztuczną inteligencję?
Meta, poprzez swoje laboratorium badawcze FAIR (Fundamental AI Research), już pracuje nad rozwojem AI opartym na modelach świata. Choć FAIR pierwotnie koncentrowało się na rozwijaniu produktów Meta, laboratorium w ostatnich latach skupiło się wyłącznie na długoterminowych badaniach nad AI. Co ciekawe, LeCun zaznacza, że FAIR obecnie nie korzysta z dużych modeli językowych.
Jednak mimo potencjału, LeCun przyznaje, że wciąż jesteśmy daleko od pełnego urzeczywistnienia modeli świata. „Będzie to wymagało lat pracy, o ile nie dekady, zanim uda się rozwiązać wszystkie problemy,” mówi LeCun. Nawet Mark Zuckerberg nieustannie pyta go, kiedy te technologie staną się rzeczywistością.
Podsumowując, chociaż modele świata otwierają nowe możliwości w rozwoju sztucznej inteligencji, przed nami wciąż długa droga. Jak LeCun podkreśla, osiągnięcie poziomu inteligencji ludzkiej przez AI to proces znacznie bardziej skomplikowany, niż możemy sobie wyobrazić.