Anjney „Anj” Midha z Andreessen Horowitz, partner generalny funduszu i członek zarządu Mistral, po raz pierwszy dostrzegł niesamowity potencjał DeepSeek około sześć miesięcy temu. Wszystko zaczęło się od wprowadzenia Coder V2, technologii stworzonej przez DeepSeek, która, jak twierdzą eksperci, dorównywała modelowi GPT-4 Turbo od OpenAI w zadaniach związanych z programowaniem. To wydarzenie otworzyło drogę do kolejnych ulepszeń modelu, prowadząc aż do premiery R1 – otwartego modelu dedukcyjnego, który przyciąga uwagę branży technicznej nie tylko swoimi możliwościami, ale także znacząco niższymi kosztami użytkowania w porównaniu do konkurencji.
Chociaż wycena takich gigantów jak Nvidia mocno ucierpiała na skutek rosnącej dominacji DeepSeek, Midha podkreśla, że nowy model R1 nie oznacza końca inwestycji w infrastrukturę obliczeniową, taką jak centra danych czy procesory GPU. Wręcz przeciwnie, jego zdaniem branża stanie się bardziej efektywna w wykorzystywaniu istniejących zasobów, co przyspieszy rozwój sztucznej inteligencji.
„Ludzie pytają mnie: skoro Mistral zebrał miliard dolarów, czy to oznacza, że ta kwota jest teraz niepotrzebna dzięki DeepSeek?” – mówi Midha. „Odpowiedź brzmi: nie. Wręcz przeciwnie, te pieniądze są niezwykle cenne, ponieważ pozwalają firmie wykorzystać innowacje DeepSeek, a następnie wzmocnić je własnymi zasobami finansowymi”. Według niego, dzięki takim przełomowym rozwiązaniom możliwe jest zwiększenie efektywności obliczeniowej nawet dziesięciokrotnie.
Midha zauważa, że Mistral – mimo swojego stosunkowo mniejszego finansowania w porównaniu z gigantami pokroju OpenAI czy Anthropic – ma przewagę dzięki podejściu open source. Otwarte oprogramowanie pozwala firmom na korzystanie z pracy społeczności technicznej, co znacząco obniża koszty rozwoju. Firmy zamknięte muszą natomiast finansować całą infrastrukturę i zespoły eksperckie samodzielnie, co generuje ogromne nakłady finansowe.
„Nie potrzebujesz 20 miliardów dolarów. Wystarczy więcej mocy obliczeniowej niż jakikolwiek inny model open source” – wyjaśnia, podkreślając, że Mistral jest aktualnie liderem w tej dziedzinie.
Konkurencyjne podejście Facebooka, który rozwija model Llama jako największą open source’ową alternatywę na Zachodzie, również oznacza wzrost inwestycji w infrastrukturę AI. Mark Zuckerberg ogłosił niedawno plany wydania setek miliardów dolarów na rozwój technologii AI, w tym 60 miliardów dolarów jedynie w 2025 roku na budowę centrów danych. To tylko kolejny dowód na to, jak istotną rolę odgrywa obecnie sztuczna inteligencja w globalnym biznesie technologicznym.
Oxygen – kluczowy projekt wspierający sektory AI i GPU
Aby sprostać rosnącemu zapotrzebowaniu na najnowocześniejsze procesory graficzne (GPU), Midha wspiera także program Oxygen, stworzony przez a16z (Andreessen Horowitz). Projekt ma na celu zaopatrywanie portfelowych firm funduszu w niezbędne zasoby obliczeniowe, takie jak wysoko cenione procesory Nvidia H100. Oxygen cieszy się jednak tak dużym zainteresowaniem, że obecnie jest „przepełniony” – jak opisuje to sam Midha. „Nie mogę przydzielić wystarczającej liczby GPU, ponieważ zapotrzebowanie jest ogromne” – śmieje się ekspert, zauważając, że startupy nadal potrzebują mocy obliczeniowej zarówno do trenowania modeli AI, jak i ich późniejszego wdrażania w produktach rynkowych.
Ta zjawiskowa popularność AI to również powód, dla którego innowacyjność DeepSeek nie wpłynie na takie projekty jak gigantyczne partnerstwo OpenAI z SoftBankiem i Oracle o wartości 500 miliardów dolarów, mające na celu budowę nowych centrów danych dla AI. Midha wskazuje, że przyszłość infrastruktury technologicznej jest kluczowa nie tylko dla firm, ale również dla poszczególnych państw.
Sztuczna inteligencja jako infrastruktura przyszłości
DeepSeek przyczynia się do zmiany myślenia o AI na poziomie państwowym, gdzie sztuczna inteligencja zaczyna być postrzegana jako infrastruktura równie kluczowa co energia elektryczna czy internet. Midha apeluje o „niezależność infrastruktury” w świecie AI, zachęcając kraje zachodnie do korzystania z modeli opartych na fundamencie demokratycznych standardów etycznych i prawa. Jednocześnie przestrzega przed uzależnieniem się od modeli pochodzących z Chin, które mogą naruszać zasady prywatności i być podatne na ingerencję polityczną. W efekcie setki firm zdecydowały się zablokować dostęp do technologii DeepSeek, obawiając się ryzyka związanego z danymi.
Niemniej nie wszyscy podzielają ten sceptycyzm wobec rozwiązań open source z Chin – niektóre firmy uruchamiają takie modele lokalnie w swoich centrach danych, co pozwala na kontrolę nad bezpieczeństwem danych. Co więcej, dostępność DeepSeek na platformach takich jak Microsoft Azure Foundry udowadnia, że modele AI można integrować na własnych zasadach, niezależnie od ich geograficznego pochodzenia.
Pomimo wyzwań, zapotrzebowanie na GPU i infrastrukturę AI pozostaje ogromne, a Anjney Midha żartobliwie dodaje: „Jeśli macie nadmiar GPU, wyślijcie je do mnie!”.