W dzisiejszych czasach rozwój centrów danych i technologii obliczeniowych nabiera niespotykanego dotąd tempa. Aby sprostać wymaganiom nowoczesnej infrastruktury oraz wspierać otwarte i skalowalne rozwiązania, NVIDIA ogłosiła, że przekazała kluczowe elementy swojej platformy przyspieszonego obliczania Blackwell na rzecz Open Compute Project (OCP). Dodatkowo, firma rozszerzyła wsparcie dla standardów OCP w ramach swojego systemu NVIDIA Spectrum-X™.
Kluczowe elementy platformy NVIDIA Blackwell
Podczas tegorocznego szczytu OCP, NVIDIA zaprezentuje kluczowe składniki systemu NVIDIA GB200 NVL72, zbudowanego na podstawie platformy obliczeniowej Blackwell. W skład tej prezentacji wejdą między innymi szczegółowe informacje o architekturze rackowej, tacach obliczeniowych oraz przełącznikach, specyfikacjach chłodzenia cieczą i termicznych, a także o pojemności kabli NVIDIA NVLink™, które umożliwią obsługę większej gęstości obliczeń oraz zwiększoną przepustowość sieciową.
NVIDIA kontynuuje swoje zaangażowanie w rozwój otwartych standardów. Wcześniej firma przekazała na rzecz OCP takie technologie jak projekt podłoża NVIDIA HGX™ H100, które umożliwiło producentom na całym świecie tworzenie szerszej gamy produktów opartych na sztucznej inteligencji (AI).
Rozwój platformy Spectrum-X w zgodzie z OCP
Jednym z najważniejszych usprawnień zaprezentowanych przez firmę jest zgodność platformy sieciowej NVIDIA Spectrum-X z wymaganiami OCP. Dzięki temu firmy mogą wdrażać sprzęt zatwierdzony przez OCP, jednocześnie wykorzystując pełny potencjał tzw. „fabryk AI”, a także zachowując dotychczasowe inwestycje w infrastrukturę i spójność oprogramowania.
Według CEO NVIDIA, Jensena Huanga, firma od dziesięciu lat współpracuje z OCP, wspólnie z liderami branży opracowując specyfikacje i projekty, które mogą być szeroko stosowane w centrach danych. „Dążymy do tworzenia otwartych standardów, które pomagają organizacjom na całym świecie w pełni wykorzystać potencjał przyspieszonych technologii obliczeniowych, budując fabryki przyszłości oparte na AI” – dodał Huang.
Platforma na miarę kolejnej rewolucji przemysłowej
NVIDIA stale rozwija swoje narzędzia obliczeniowe, aby sprostać nowemu wymiarowi sztucznej inteligencji. NVIDIA GB200 NVL72 oparty na modułowej architekturze NVIDIA MGX™ pozwala producentom budować infrastrukturę centrów danych na dużą skalę, szybko i efektywnie kosztowo.
System ten, chłodzony cieczą, integruje 36 procesorów NVIDIA Grace™ CPU oraz 72 procesory graficzne NVIDIA Blackwell GPU. Dzięki technologii NVLink, wszystkie 72 GPU mogą współpracować jako jeden potężny procesor, zapewniając 30-krotnie wyższą wydajność niż dotychczasowe NVIDIA H100 Tensor w czasie rzeczywistym, szczególnie przy przetwarzaniu ogromnych modeli językowych.
Nowa generacja technologii sieciowych
NVIDIA Spectrum-X jest kluczowym elementem dla przyszłości AI i przyspieszonych obliczeń. W połączeniu z nowym NVIDIA ConnectX-8 SuperNIC™, platforma ta wspiera standardy OCP, takie jak interfejs abstrakcji przełączników (Switch Abstraction Interface, SAI) oraz Software for Open Networking in the Cloud (SONiC). Klienci mogą dzięki temu wykorzystać zaawansowane technologie, takie jak dynamiczne trasowanie oraz kontrolę przeciążeń w sieciach, co pozwala na optymalizację wydajności infrastruktury AI skali horyzontalnej.
Karta ConnectX-8 SuperNIC™ oferuje prędkość do 800 Gb/s i jest zoptymalizowana do obsługi obciążeń związanych z AI na skalę masową. Zgodność z OCP 3.0 zapewni jeszcze większą elastyczność w budowie nowoczesnych sieci.
Kluczowe elementy infrastruktury centrów danych
W miarę jak świat przechodzi od tradycyjnych obliczeń ogólnego przeznaczenia do przyspieszonych obliczeń i AI, infrastruktura centrów danych staje się coraz bardziej złożona. NVIDIA współpracuje z ponad 40 globalnymi producentami elektroniki, dostarczając kluczowe komponenty dla budowy tzw. „fabryk AI”. Rozwiązania te mają na celu uproszczenie procesu rozwoju i wdrażania infrastruktury AI w skali globalnej.
Wśród współpracujących partnerów jest m.in. Meta, która buduje swoją architekturę rackową Catalina opartą na GB200 NVL72 i planuje przekazać te rozwiązania na rzecz OCP. Dzięki temu producenci komputerów zyskują większą elastyczność w realizacji systemów o wysokiej gęstości obliczeniowej, spełniając jednocześnie rosnące potrzeby centrów danych w zakresie wydajności i efektywności energetycznej.
Jak podkreślił Yee Jiun Song, wiceprezes działu inżynierii w Meta, NVIDIA od lat jest kluczowym partnerem w rozwijaniu standardów otwartego obliczania. Najnowsze wkłady NVIDIA w dziedzinie projektowania racków i architektur modułowych przyspieszą rozwój całej branży AI.
Podsumowanie
NVIDIA po raz kolejny dowiodła, że jest liderem w dziedzinie przyspieszonych obliczeń i sztucznej inteligencji, dostarczając nie tylko nowatorskie technologie, ale także wspierając rozwój otwartych standardów. Przekazanie kluczowych elementów platformy Blackwell oraz rozwój Spectrum-X w zgodzie ze standardami OCP to kolejny krok w stronę budowy przyszłych centrów danych, które będą fundamentem nowej ery AI.