ChatGPT otworzył nową erę sztucznej inteligencji generatywnej, która zrewolucjonizowała takie dziedziny jak tworzenie treści, obsługa klienta, rozwój oprogramowania i operacje biznesowe. Dzięki możliwości generowania odpowiedzi na prawie każde pytanie, sztuczna inteligencja (AI) staje się nieodłącznym narzędziem w pracy cyfrowej. Jednak AI w fizycznym świecie – czyli sztuczna inteligencja działająca w humanoidach, fabrykach i innych urządzeniach przemysłowych – wciąż czeka na swoje przełomowe chwile.
Wzrost multimodalnej, fizycznej AI
Od sześćdziesięciu lat tradycyjne oprogramowanie (nazwane Software 1.0) – kod sekwencyjny pisany przez programistów – działało na uniwersalnych komputerach z procesorami CPU. Przełom nastąpił w 2012 roku, kiedy Alex Krizhevsky, pod okiem Ilji Sutskevera i Geoffreya Hintona, wygrał konkurs ImageNet, przedstawiając AlexNet – rewolucyjny model głębokiego uczenia (deep learning) do klasyfikacji obrazów. W tym momencie branża po raz pierwszy zetknęła się z AI, otwierając erę Software 2.0.
Dziś oprogramowanie generuje samo siebie. Obliczenia przesuwają się z procesorów CPU na akcelerowane obliczenia na kartach graficznych (GPU), co zostawia daleko w tyle prawo Moore’a. Dzięki generatywnej AI, multimodalnym modelom transformacyjnym i modelom dyfuzyjnym, sztuczna inteligencja staje się coraz bardziej zaawansowana.
Jednak modele językowe i generowania obrazów wciąż pozostają ograniczone do jednowymiarowych (np. przewidują kolejne słowo) lub dwuwymiarowych (przewidują kolejne piksele) zastosowań. To jest moment, w którym na scenę wchodzi fizyczna AI.
Fizyczna AI to modele, które mogą odbierać bodźce z otoczenia, rozumieć je, wchodzić w interakcje, a także nawigować w fizycznym świecie. Dzięki akcelerowanym obliczeniom i symulacjom opartym na fizyce, fizyczna AI staje się rzeczywistością, a roboty napędzane tymi technologiami zaczynają odgrywać coraz większą rolę w naszym codziennym życiu.
Kolejna granica: humanoidalne roboty
Humanoidalne roboty stanowią idealną formę robotów ogólnego przeznaczenia. Dzięki swojej budowie mogą działać w środowiskach zaprojektowanych dla ludzi, wymagając jednocześnie minimalnych dostosowań do efektywnego funkcjonowania. Przewiduje się, że globalny rynek humanoidalnych robotów wzrośnie do 38 miliardów dolarów do 2035 roku, co stanowi ogromny skok w porównaniu do wcześniejszych prognoz sprzed dwóch lat.
Naukowcy i inżynierowie na całym świecie intensywnie pracują nad budową kolejnej generacji tych robotów. Aby ten rozwój był możliwy, potrzebne są trzy kluczowe systemy komputerowe, które umożliwiają trening, symulację oraz działanie fizycznej AI.
Trzy komputery dla rozwoju fizycznej AI
Do opracowania humanoidalnych robotów potrzebne są zaawansowane systemy komputerowe. Dwa kluczowe osiągnięcia technologiczne napędzają rozwój humanoidów: multimodalne modele bazowe oraz skalowalne symulacje fizyczne świata robotów.
– Pierwszy krok: Trening modelu na superkomputerach. Programiści mogą korzystać z platform takich jak NVIDIA NeMo na platformie NVIDIA DGX, aby trenować i dopracowywać modele AI. Mogą również wykorzystać NVIDIA Project GR00T do rozwijania ogólnych modeli bazowych dla robotów humanoidalnych, które pozwalają im rozumieć język naturalny i naśladować ruchy obserwowane u ludzi.
– Drugi krok: Symulacja i testowanie. NVIDIA Omniverse, działający na serwerach NVIDIA OVX, zapewnia platformę do tworzenia i testowania fizycznej AI. Programiści mogą wykorzystać symulacje i API takie jak NVIDIA Isaac Sim do testowania modeli robotów w wirtualnych środowiskach.
– Trzeci krok: Wdrażanie przeszkolonych modeli na komputerach czasu rzeczywistego. Komputery NVIDIA Jetson Thor zostały zaprojektowane do pracy na pokładzie robotów, umożliwiając wdrożenie modeli AI w środowiskach rzeczywistych.
Budowa autonomicznych obiektów przemysłowych
Wprowadzenie tych technologii pozwala na rozwój autonomicznych fabryk i obiektów przemysłowych. Przykładem mogą być producenci, tacy jak Foxconn, którzy wykorzystują zespoły autonomicznych robotów do pracy u boku ludzkich pracowników oraz do monitorowania operacji fabrycznych. Dzięki symulacjom robotów i symulacjom cyfrowych bliźniaków, firmy te mogą optymalizować swoje procesy przed wprowadzeniem ich do rzeczywistych środowisk.
Takie symulacje umożliwiają testowanie i optymalizację pracy robotów w wirtualnych fabrykach, co pozwala na minimalizowanie kosztów i ryzyka podczas rzeczywistego wdrażania.
Wsparcie dla ekosystemu twórców robotów
NVIDIA w znacznym stopniu wspiera ekosystem twórców robotów, dostarczając zaawansowane narzędzia i platformy. Firmy takie jak Universal Robots, Boston Dynamics i Fourier korzystają z technologii NVIDIA do rozwoju humanoidalnych robotów oraz autonomicznych maszyn do pracy w różnych środowiskach przemysłowych.
Przyszłość należy do fizycznej AI, a jej rozwój zmienia nie tylko świat technologii, ale także przemysł ciężki oraz robotykę.