Nowy model AI – OLMo 2 – już dostępny jako w pełni otwarte rozwiązanie
Świat sztucznej inteligencji stale się rozwija, a na rynku pojawia się coraz więcej interesujących i zaawansowanych modeli językowych. Jedną z najnowszych propozycji w tej dziedzinie jest OLMo 2, rodzina modeli opracowana przez Ai2 – organizację badawczą zainicjowaną przez Paula Allena, współzałożyciela Microsoftu. To, co wyróżnia OLMo 2, to jego pełna otwartość – zarówno dane, jak i narzędzia użyte do jego stworzenia są ogólnodostępne, co spełnia ścisłe standardy Open Source Initiative.
—
Co to jest OLMo 2 i dlaczego jest wyjątkowy?
OLMo, czyli skrót od „Open Language Model”, to rodzina modeli językowych, które można nie tylko dowolnie wykorzystywać, ale również w pełni odtworzyć dzięki udostępnionym publicznie zasobom. W październiku 2024 roku Open Source Initiative, globalna instytucja zajmująca się definiowaniem i promowaniem otwartych standardów, sformalizowała definicję otwartego AI. OLMo 2 już wcześniej spełniał te wymagania, a teraz staje się jeszcze bardziej zaawansowanym narzędziem, które cieszy się dużym zainteresowaniem w społeczności technologicznej.
Według twórców, OLMo 2 został opracowany w pełni transparentnie. Proces ten obejmował otwarte dane treningowe, dostępny publicznie kod, szczegółowe przepisy treningowe, wyniki ocen wydajności oraz udostępnienie pośrednich etapów szkolenia. To podejście jest unikalne w branży sztucznej inteligencji, która z roku na rok staje się bardziej zamknięta i zdominowana przez duże korporacje. Dzięki temu projektowi Ai2 chce wspierać odkrywanie nowych rozwiązań w dziedzinie AI i zachęcać społeczność do dalszych badań.
—
Dwa modele – 7B i 13B – i ich możliwości
Rodzina OLMo 2 składa się z dwóch głównych wariantów: OLMo 7B (o 7 miliardach parametrów) oraz OLMo 13B (o 13 miliardach parametrów). Parametry w modelach językowych są miarą ich zdolności rozwiązywania problemów – im więcej parametrów, tym lepsze wyniki można uzyskać. Modele te zostały zaprojektowane do wykonywania szerokiego zakresu zadań tekstowych, takich jak odpowiadanie na pytania, streszczanie dokumentów, a nawet generowanie kodu.
Do treningu modeli Ai2 wykorzystało zestaw danych zawierający 5 bilionów tokenów – jednostek danych reprezentujących fragmenty tekstu. Aby zapewnić wysoką jakość modelu, dane obejmowały starannie przefiltrowane strony internetowe, prace naukowe, fora Q&A oraz podręczniki matematyczne, zarówno generowane przez ludzi, jak i syntetyczne. Taka selekcja pozwoliła stworzyć modele, które są nie tylko wydajne, ale również bardziej wiarygodne w porównaniu z innymi rozwiązaniami dostępnymi na rynku.
—
Jak wypada OLMo 2 na tle konkurencji?
Ai2 twierdzi, że OLMo 2 dorównuje najnowszym modelom open source, takim jak Llama 3.1 wydany przez Meta. Co więcej, w testach porównawczych model OLMo 2 7B przewyższa Llama 3.1 8B w wielu zadaniach. To znaczące osiągnięcie, które świadczy o zdolnościach zespołu Ai2 w rozwijaniu nowoczesnych technologii AI.
Warto również podkreślić, że OLMo 2 jest dostępny na licencji Apache 2.0, co umożliwia zarówno jego komercyjne, jak i niekomercyjne wykorzystanie. Wszystkie komponenty modelu, w tym dane i narzędzia, można pobrać bezpłatnie z oficjalnej strony Ai2, co daje użytkownikom pełną swobodę w jego implementacji.
—
Otwartość kontra bezpieczeństwo: kontrowersje wokół modeli open source
Pomimo wielu zalet otwartych modeli, takich jak OLMo 2, pojawiają się również obawy dotyczące ich potencjalnego niewłaściwego wykorzystania. Przykładem mogą być chińscy badacze, którzy według doniesień wykorzystali modele Llama do opracowania narzędzi obronnych. Podobne ryzyko istnieje również w przypadku OLMo 2. Dirk Groeneveld, inżynier z Ai2, przyznał, że takie zagrożenia są realne, ale podkreślił, że korzyści wynikające z otwartości przeważają nad potencjalnymi zagrożeniami.
Groeneveld zauważył, że otwarte modele sprzyjają postępowi technologicznemu i opracowywaniu bardziej etycznych rozwiązań. Ponadto, otwartość zapewnia weryfikowalność i reprodukowalność wyników, co jest kluczowe w badaniach naukowych.
—
Podsumowanie
OLMo 2 stanowi ważny krok naprzód w rozwoju otwartych modeli sztucznej inteligencji. Jego pełna transparentność, wysoka wydajność oraz wsparcie dla społeczności open source czynią go jednym z najbardziej obiecujących projektów w dziedzinie AI. Dzięki swojej dostępności i elastyczności może znaleźć zastosowanie zarówno w celach edukacyjnych, jak i komercyjnych.
Otwarta technologia, taka jak OLMo 2, ma szansę zrewolucjonizować podejście do sztucznej inteligencji, promując równy dostęp do zaawansowanych narzędzi. Jednakże, jak każde nowe rozwiązanie, wymaga odpowiedzialnego podejścia i dalszych dyskusji na temat etyki oraz bezpieczeństwa.