Amazon Web Services (AWS) oraz NVIDIA ogłosiły znaczące poszerzenie swojej strategicznej współpracy podczas konferencji AWS re:Invent. Współpraca ta ma na celu zapewnienie klientom najnowocześniejszej infrastruktury, oprogramowania i usług, które będą napędzać innowacje w dziedzinie generatywnej sztucznej inteligencji.
Współpraca łączy siły obu firm, integrując najnowsze wielowęzłowe systemy NVIDIA z nowoczesnymi GPU, CPU oraz oprogramowaniem AI, wraz z technologiami AWS takimi jak zaawansowana wirtualizacja Nitro System, łącze Elastic Fabric Adapter (EFA) i skalowalność UltraCluster.
Główne punkty rozszerzonej współpracy to:
Wprowadzenie superczipów NVIDIA GH200 Grace Hopper w AWS: AWS staje się pierwszym dostawcą chmury oferującym superczipy NVIDIA GH200 Grace Hopper z nową technologią wielowęzłowego NVLink. Platforma wielowęzłowa NVIDIA GH200 NVL32 umożliwia wspólnym klientom skalowanie do tysięcy superczipów GH200, zapewniając wydajność na poziomie superkomputerów. Hosting NVIDIA DGX Cloud w AWS: Współpraca w celu hostowania NVIDIA DGX Cloud, usługi szkoleniowej AI w chmurze, na AWS, z wykorzystaniem GH200 NVL32 do przyspieszonego szkolenia generatywnego AI i dużych modeli językowych. Superkomputer projektu Ceiba: Współpraca nad projektem Ceiba, mająca na celu zaprojektowanie najszybszego na świecie superkomputera AI zasilanego GPU z 16 384 superczipami NVIDIA GH200 i zdolnością przetwarzania na poziomie 65 exaflopsów. Wprowadzenie nowych instancji Amazon EC2: AWS wprowadza trzy nowe instancje Amazon EC2, w tym instancje P5e zasilane przez GPU NVIDIA H200 Tensor Core dla dużych obciążeń generatywnej AI i HPC. Innowacje oprogramowania: NVIDIA wprowadza oprogramowanie na AWS, takie jak mikrousługa NeMo Retriever dla chatbotów i narzędzi do podsumowywania oraz BioNeMo, przyspieszające odkrywanie leków dla firm farmaceutycznych. Współpraca ta sygnalizuje wspólne zaangażowanie w rozwój generatywnej AI, oferując klientom dostęp do najnowocześniejszych technologii i zasobów.
Wewnętrznie zespoły Amazon Robotics i Fulfilment już korzystają z platformy Omniverse NVIDIA do optymalizacji magazynów w wirtualnych środowiskach przed rzeczywistym wdrożeniem.
Integracja technologii NVIDIA i AWS przyspieszy rozwój, szkolenie i wnioskowanie dużych modeli językowych oraz aplikacji generatywnej AI w różnych branżach.