Inflection, startup AI dążący do stworzenia „osobistego AI dla każdego”, ogłosił nowy duży model językowy o nazwie Inflection-2, który przewyższa model Google’a PaLM 2.
Inflection-2 został wytrenowany na ponad 5000 procesorach graficznych NVIDIA, osiągając 1,025 biliona operacji zmiennoprzecinkowych na sekundę (FLOPs), co stawia go w tej samej klasie co PaLM 2 Large. Jednakże, wstępne testy porównawcze pokazują, że Inflection-2 przewyższa model Google’a pod względem zdolności rozumowania, wiedzy faktycznej i wirtuozerii stylistycznej.
W szeregu powszechnie stosowanych akademickich testów AI, Inflection-2 osiągnął wyższe wyniki niż PaLM 2 w większości z nich. Obejmowało to lepsze wyniki niż flagowy model giganta wyszukiwarkowego w różnorodnych testach Multi-task Middle-school Language Understanding (MMLU), jak również w TriviaQA, HellaSwag i testach matematycznych dla szkół podstawowych (GSM8k):
Nowy model startupu wkrótce będzie napędzał jego osobistą aplikację asystencką Pi, umożliwiając bardziej naturalne konwersacje i użyteczne funkcje.
Inflection ogłosiło, że przejście z procesorów graficznych NVIDIA A100 na H100 do wnioskowania – w połączeniu z pracami optymalizacyjnymi – zwiększy prędkość obsługi i obniży koszty, pomimo że Inflection-2 jest znacznie większy niż jego poprzednik.
Rzecznik Inflection stwierdził, że ten najnowszy model zbliża ich „o duży krok” do realizacji misji zapewnienia asystentów AI dla wszystkich. Dodał również, że zespół „już z niecierpliwością czeka” na trenowanie jeszcze większych modeli na ich superklasterze z 22 000 procesorów GPU.
Bezpieczeństwo jest podobno najwyższym priorytetem dla badaczy, a Inflection jest jednym z pierwszych sygnatariuszy dobrowolnych zobowiązań AI Białego Domu z lipca 2023 roku. Firma stwierdziła, że jej zespół ds. bezpieczeństwa nadal pracuje nad zapewnieniem, że modele są rygorystycznie oceniane i opierają się na najlepszych praktykach w zakresie dostosowania.
Z imponującymi wynikami testów i planami dalszej skali, najnowsze osiągnięcie Inflection stanowi poważne wyzwanie dla technologicznych gigantów takich jak Google i Microsoft, którzy do tej pory dominowali w dziedzinie dużych modeli językowych. Rozpoczęła się wyścig o dostarczenie kolejnej generacji AI.