1X, firma stojąca za humanoidalnym robotem Neo, zapowiedziała nowy model sztucznej inteligencji, który — jak twierdzi spółka — rozumie dynamikę świata rzeczywistego i pozwala robotom uczyć się nowych umiejętności samodzielnie. Model nazwano 1X World Model; jest to rozwiązanie oparte na fizyce, które łączy analizę wideo z instrukcjami tekstowymi (promptami), by rozszerzać zdolności robotów Neo poza zakres wcześniejszego treningu.
W praktyce 1X World Model wykorzystuje materiały wideo jako źródło informacji o tym, jak wykonuje się konkretne czynności w rzeczywistym świecie, a prompty kierują interpretacją tych nagrań — dzięki temu roboty mogą przyswajać zadania, na które wcześniej nie były trenowane. To podejście ma pozwolić systemowi uczyć się z „internetowej skali” wideo i następnie przekładać tę wiedzę na działania wykonywane w fizycznym świecie.
Firma przypomina jednak, że stwierdzenie o możliwości przekształcenia „dowolnego promptu” w nową akcję należy traktować z ostrożnością. Jak zauważono, nie oznacza to, że wystarczy poprosić Neo o prowadzenie samochodu, by natychmiast opanował np. parkowanie równoległe. Istnieje proces integracji wiedzy — nagrania wideo powiązane z konkretnymi promptami są przesyłane z robota do modelu światowego, a zaktualizowane reprezentacje wracają potem do sieci urządzeń, co stopniowo zwiększa ich zrozumienie otoczenia i zasób umiejętności.
Taki cykl — zbieranie wideo, powiązanie go z instrukcjami, aktualizacja modelu i dalsze rozpowszechnianie wiedzy wśród robotów — daje także użytkownikom wgląd w to, jak Neo planuje się zachować wobec danego polecenia. Informacje o przewidywanym zachowaniu mogą pomóc inżynierom i trenerom modelu doskonalić system, tak aby w przyszłości roboty potrafiły reagować na polecenia, których nigdy wcześniej nie realizowały.
Ogłoszenie 1X pojawia się w czasie, gdy firma przygotowuje się do wprowadzenia robotów Neo do użytku domowego. W październiku uruchomiono możliwość składania przedsprzedaży, a plan wysyłek przewidziano „w tym roku”. Rzecznik firmy odmówił podania dokładnego harmonogramu dostaw ani liczby zamówień, ograniczając się do stwierdzenia, że przedsprzedaże „przekroczyły oczekiwania”.
W kontekście rozwoju robotyki domowej znaczenie tej zapowiedzi polega na przesunięciu w kierunku systemów, które mogą samodzielnie wykorzystywać obserwacje zrealizowane w prawdziwym świecie do rozszerzania własnych umiejętności. To etap rozwoju, w którym modele uczące się z multimodalnych danych (wideo + tekst) zaczynają tworzyć pętlę uczenia zbiorowego — aktualizacje jednego egzemplarza mogą z czasem podnosić kompetencje całej floty urządzeń.
Informacyjnie: w kalendarzu branżowym zaplanowane jest wydarzenie w San Francisco w dniach 13–15 października 2026 roku.