NVIDIA ogłosiła przejęcie SchedMD — firmy stojącej za Slurmem, otwartoźródłowym systemem do zarządzania obciążeniem w obliczeniach wysokiej wydajności (HPC) i w zastosowaniach sztucznej inteligencji. Celem transakcji ma być wzmocnienie ekosystemu oprogramowania open source oraz przyspieszenie innowacji w zakresie AI dla badaczy, deweloperów i przedsiębiorstw. NVIDIA zadeklarowała, że będzie dalej rozwijać i udostępniać Slurma jako oprogramowanie open source, neutralne wobec dostawców, tak aby pozostał szeroko dostępny i wspierany przez całą społeczność HPC i AI w różnych środowiskach sprzętowych i programowych.
Slurm to system do kolejkowania, planowania i przydzielania zasobów obliczeniowych, niezbędny tam, gdzie równolegle działa wiele zadań na klastrach obliczeniowych. W praktyce oznacza to organizowanie pracy setek lub tysięcy procesów rozłożonych na wiele węzłów, tak aby wykorzystanie sprzętu było jak najbardziej efektywne. W miarę jak klastry stają się większe i bardziej wydajne, skuteczne zarządzanie zasobami ma bezpośredni wpływ na czas realizacji zadań i koszty ich uruchamiania.
Slurm jest uznawany za wiodący menedżer obciążenia pod względem skalowalności, przepustowości i możliwości realizacji złożonych polityk zarządzania. System jest używany w więcej niż połowie systemów z pierwszej dziesiątki oraz pierwszej setki rankingu TOP500 superkomputerów, co świadczy o jego roli w najbardziej wymagających środowiskach obliczeniowych. Slurm jest także wspierany na najnowszym sprzęcie NVIDIA i jest elementem krytycznej infrastruktury potrzebnej do rozwoju generatywnej AI — używają go twórcy modeli bazowych i zespoły zajmujące się trenowaniem modeli oraz obsługą zapytań (inference).
„Jesteśmy podekscytowani możliwością dołączenia do NVIDIA — to ostateczne potwierdzenie kluczowej roli Slurma w najbardziej wymagających środowiskach HPC i AI na świecie” — powiedział Danny Auble, CEO SchedMD. „Głębokie doświadczenie NVIDIA i jej inwestycje w obliczenia przyspieszone sprzętowo przyspieszą rozwój Slurma — który nadal pozostanie oprogramowaniem open source — aby sprostać wymaganiom kolejnej generacji AI i superkomputerów.”
NVIDIA i SchedMD współpracują od ponad dekady, a po przejęciu NVIDIA zapowiada kontynuację inwestycji w rozwój Slurma, aby utrzymać jego pozycję jako wiodącego otwartoźródłowego systemu zarządzania zadaniami w obszarze HPC i AI. Firma deklaruje, że przyspieszy dostęp SchedMD do nowych systemów, co ma umożliwić użytkownikom platformy przyspieszonych obliczeń NVIDIA optymalizację obciążeń w całej infrastrukturze obliczeniowej.
Jednocześnie NVIDIA podkreśla, że będzie wspierać zróżnicowany ekosystem sprzętowy i programowy, tak aby klienci mogli uruchamiać heterogeniczne klastry — łączące różne typy procesorów i akceleratorów — korzystając z najnowszych innowacji Slurma. Obejmuje to kontynuację wsparcia open source, szkoleń i prac rozwojowych dla setek klientów SchedMD, wśród których są dostawcy chmurowi, producenci sprzętu, firmy zajmujące się AI oraz laboratoria badawcze.
Lista branż korzystających ze wsparcia obejmuje m.in. projekty związane z autonomiczną jazdą, ochroną zdrowia i naukami przyrodniczymi, energetyką, usługami finansowymi, przemysłem wytwórczym oraz instytucje rządowe. Działania te mają na celu wzmocnienie ekosystemu oprogramowania open source i przyspieszenie innowacji w obszarze HPC i AI w różnych sektorach gospodarki, niezależnie od skali wdrożeń.