Na konferencji „Code with Claude” firma Anthropic oficjalnie zaprezentowała najnowsze wersje swoich dużych modeli językowych – Claude Opus 4 oraz Claude Sonnet 4. Te innowacyjne narzędzia, dedykowane zarówno programistom, jak i zespołom inżynierskim, wprowadzają znaczący skok w dziedzinie kodowania, rozumowania kontekstowego i tworzenia zaawansowanych agentów AI.
Nowe modele Claude są wynikiem wytężonej pracy i ewolucji poprzednich wersji. Zyskały zdolność efektywnego rozumowania przy dużym zakresie kontekstu, co staje się kluczowe przy realizacji wieloetapowych zadań programistycznych. Głównym założeniem wdrożenia wersji Opus 4 oraz Sonnet 4 jest stworzenie modelu, który nie tylko jest elastyczny, ale też potrafi podejmować długoterminowe decyzje oraz utrzymywać ciągłość rozumowania przez setki, a nawet tysiące interakcji. W rezultacie Claude może funkcjonować jako spójny cyfrowy współpracownik, a nie jedynie narzędzie podsuwające gotowe odpowiedzi.
Modele są już dostępne w wielu ekosystemach takich jak Anthropic API, Amazon Bedrock oraz Google Vertex AI. Co więcej, model Claude Sonnet 4 można bezpłatnie wypróbować na Claude.ai, natomiast Opus 4 jest dostępny w opcji premium. Strategia dystrybucji jasno wskazuje na dążenie firmy do szerokiego popularyzowania rozwiązań AI dostosowanych do różnorodnych potrzeb i budżetów użytkowników.
Claude Opus 4 to flagowy model Anthropic – najbardziej zaawansowana wersja, która, według twórców, ustanawia nowe standardy w dziedzinie kodowania. W testach benchmarkowych model pokazał niesamowitą skuteczność – m.in. GitHub zaobserwował wzrost wydajności o 9% przy jednoczesnym zmniejszeniu zapotrzebowania na tokeny o 30% w porównaniu do wcześniejszej wersji. Takie wyniki potwierdzają, że Opus 4 nie tylko programuje z większą precyzją, ale również potrafi optymalizować zużywane zasoby, co ma kluczowe znaczenie przy integracji z rozwiązaniami korporacyjnymi.
Jednym z najbardziej imponujących przypadków użycia modelu Opus 4 było jego samodzielne programowanie przez niemal siedem godzin podczas testów u japońskiego giganta technologicznego Rakuten. Model radził sobie z złożonym projektem open-source bez jakiejkolwiek redundancji, co otwiera drzwi dla autonomicznych agentów programujących, narzędzi do analizowania dużych baz kodu oraz wirtualnych asystentów programistów nowej generacji.
Z kolei Claude Sonnet 4 to wyjątkowy balans pomiędzy mocą obliczeniową a ekonomiką działania. Zaprojektowany z myślą o użytkownikach poszukujących niezawodności i wydajności w cenie przystępnej dla szerokiego grona odbiorców, nowy Sonnet osiągnął 72,7% w znanym benchmarku SWE-bench (wzrost z 62,3% względem wersji 3.7). To wynik, który czyni go bezkonkurencyjnym wśród ekonomicznych modeli językowych obecnych obecnie na rynku.
Jedną z nowatorskich funkcji, które pojawiły się w obu modelach, jest możliwość korzystania z narzędzi podczas procesu rozumowania. Claude Opus 4 i Sonnet 4 potrafią teraz integrować wyszukiwarki internetowe jako wsparcie w analizie danych oraz samodzielnie przełączać się pomiędzy narzędziami a myśleniem w zależności od potrzeb. Te modele są również w stanie używać kilku narzędzi równocześnie, co stanowi ogromne usprawnienie w zakresie złożonych operacji wymagających wielu źródeł danych i synchronizacji.
Kolejne udoskonalenie to dostęp modeli do lokalnych plików użytkownika, co pozwala im zapamiętywać istotne informacje, budując coś w rodzaju pamięci długoterminowej. Funkcjonalność ta potencjalnie czyni Claude potężnym narzędziem dla użytkowników pracujących nad projektami rozciągniętymi w czasie, gdzie istotne jest zachowanie ciągłości informacji i podejmowanych decyzji.
Anthropic zaprezentowało także Claude Code – specjalistyczne narzędzie programistyczne, które właśnie stało się ogólnodostępne. Claude Code działa w terminalu oraz jako wtyczka do popularnych środowisk programistycznych takich jak VS Code oraz JetBrains. Firma wyraźnie pozycjonuje się jako główny konkurent dla popularnych rozwiązań jak GitHub Copilot czy edytora Cursor. Ponadto programiści mogą teraz wykorzystać nowo udostępniony SDK Claude Code do tworzenia własnych agentów AI, co stwarza nowe możliwości w zakresie personalizacji i rozszerzania funkcjonalności AI w pracy z kodem.
Nie bez znaczenia pozostaje także fakt, że nowe modele zachowują dotychczasową politykę cenową – użycie Opus 4 wyceniono na 15 dolarów za milion tokenów wejściowych oraz 75 dolarów za milion tokenów wyjściowych, natomiast Sonnet 4 to odpowiednio 3 i 15 dolarów. Taka przejrzystość i stabilność cen czyni rozwiązania Anthropic bardziej atrakcyjnymi dla firm planujących długofalową integrację AI w swoich projektach developerskich.
Nowa rodzina Claude 4 to nie tylko rozwinięcie zapowiedzi z ubiegłego roku, lecz faktyczny krok naprzód w kierunku asystentów AI, którzy nie tylko wspierają, ale potrafią pracować ramię w ramię z inżynierami. Dzięki doskonałej wydajności, wszechstronności i integracjom z narzędziami, Claude 4 może okazać się jednym z najważniejszych ogniw przyszłości programowania wspieranego przez sztuczną inteligencję.