Anthropic wprowadza nową generację sztucznej inteligencji zdolną do automatyzacji pracy na komputerze
Wprowadzenie nowego modelu AI od Anthropic
Firma Anthropic, która od dłuższego czasu pracuje nad zaawansowanymi algorytmami sztucznej inteligencji, ostatnio ogłosiła premierę nowej wersji swojego modelu AI o nazwie Claude 3.5 Sonnet. Jest to krok naprzód w rozwoju AI, który ma na celu nie tylko automatyzację procesów, ale także zwiększenie interakcji z aplikacjami komputerowymi. Dzięki nowemu API o nazwie „Computer Use” model Claude 3.5 Sonnet może teraz naśladować działania użytkownika przy komputerze, takie jak ruchy myszką, wciskanie klawiszy czy kliknięcia – tak jakby człowiek faktycznie obsługiwał komputer.
Anthropic twierdzi, że ich AI została przeszkolona tak, aby mogła „widzieć” to, co dzieje się na ekranie i wykonywać odpowiednie zadania, korzystając z dostępnych narzędzi. Model analizuje zrzuty ekranu i na ich podstawie decyduje, gdzie przesunąć kursor i jakie akcje podjąć. To otwiera drzwi do pełnej automatyzacji zadań biurowych, takich jak wypełnianie formularzy, przeglądanie stron internetowych czy obsługa aplikacji.
Automatyzacja aplikacji – czy to przyszłość?
Automatyzacja rutynowych zadań na komputerze nie jest nowym pomysłem. Na rynku istnieje wiele firm oferujących takie rozwiązania, od dostawców RPA (Robotic Process Automation) po nowe startupy, które starają się wprowadzać innowacje w tej dziedzinie. Jednak wyścig o stworzenie tzw. „agentów AI”, czyli systemów AI zdolnych do automatyzacji zadań w oprogramowaniu, nabiera tempa.
Wielu analityków przewiduje, że AI agenci mogą stać się kluczowym elementem monetyzacji inwestycji w sztuczną inteligencję, a według najnowszych badań, aż 82% firm planuje wdrożenie takich rozwiązań w ciągu najbliższych trzech lat. Zainteresowanie tym trendem wykazują także giganci technologiczni, jak Microsoft czy Salesforce, którzy ogłosili własne projekty agentów AI. OpenAI również pracuje nad podobnymi technologiami, które mogą przekształcić sposób, w jaki wykorzystujemy AI.
Nowe możliwości Claude 3.5 Sonnet
Claude 3.5 Sonnet wprowadza coś, co Anthropic nazywa „warstwą wykonawczą działań”, umożliwiając modelowi nie tylko przeglądanie internetu, ale także wykonywanie poleceń na poziomie komputera. Model ten może korzystać z dowolnej strony internetowej i aplikacji, co daje mu ogromne możliwości w automatyzacji zadań.
Użytkownicy pozostają jednak w pełni kontrolujący działania AI, dostarczając mu odpowiednich komend. Przykładem może być polecenie „użyj danych z mojego komputera i internetu, aby wypełnić ten formularz”. Claude przekształca takie polecenia w konkretne działania, takie jak przesunięcie kursora, wpisanie tekstu czy kliknięcie w odpowiedni przycisk.
Potencjalne zagrożenia i ryzyko
Mimo że technologia ta otwiera szerokie możliwości, nie jest pozbawiona ryzyka. W testach model Claude 3.5 Sonnet, mimo zaawansowanych możliwości, miał trudności z niektórymi prostymi zadaniami, jak przewijanie stron czy powiększanie ekranu. Model ma również tendencję do przeoczania krótkotrwałych akcji i powiadomień, co może prowadzić do błędów w wykonywaniu zadań.
Anthropic przyznaje, że ich AI nie jest jeszcze doskonała. Firma zaleca programistom, aby na początku testowali nową technologię na niskiego ryzyka zadaniach, aby uniknąć potencjalnych problemów.
Czy Claude 3.5 Sonnet jest wystarczająco dobry, aby stanowić zagrożenie?
Wydaje się, że możliwości Claude 3.5 Sonnet są na tyle rozwinięte, że mogą budzić obawy związane z bezpieczeństwem. Badania wykazały, że modele AI, które nie mają dostępu do komputerów, jak OpenAI GPT-4o, mogą być podatne na tzw. „jailbreaking”, co może prowadzić do niepożądanych działań. Można sobie wyobrazić, jakie zagrożenia mogłoby spowodować AI, które ma bezpośredni dostęp do aplikacji komputerowych – np. poprzez wykorzystanie luk bezpieczeństwa w oprogramowaniu.
Anthropic zdaje sobie sprawę z tych zagrożeń i podejmuje kroki, aby zminimalizować ryzyko niewłaściwego wykorzystania ich AI. Firma wprowadziła szereg zabezpieczeń, m.in. ograniczenia w dostępie do stron internetowych podczas treningu modelu i mechanizmy zapobiegające wykonaniu działań wysokiego ryzyka, takich jak publikowanie w mediach społecznościowych czy zakładanie kont online bez zgody użytkownika.
Nowe wersje modeli – tańsze i wydajniejsze
Oprócz premiery Claude 3.5 Sonnet, Anthropic zapowiedział również wprowadzenie nowego modelu Claude 3.5 Haiku, który ma być tańszą i bardziej efektywną wersją w rodzinie Claude. Model ten będzie charakteryzował się niskim opóźnieniem, lepszym przestrzeganiem instrukcji oraz dokładniejszym wykorzystaniem narzędzi. Claude 3.5 Haiku ma być dostępny na początku w wersji tekstowej, a później jako model multimodalny, który będzie potrafił analizować zarówno tekst, jak i obrazy.
Anthropic podkreśla, że każdy z ich modeli ma swoje unikalne zastosowania i będzie dostępny dla klientów w zależności od potrzeb. Firma planuje dalsze rozwijanie swojej oferty modeli, aby sprostać wymaganiom rynku.
Podsumowanie
Nowy model Claude 3.5 Sonnet od Anthropic to znaczący krok naprzód w dziedzinie sztucznej inteligencji, która ma potencjał do automatyzacji wielu zadań na komputerach. Jednak, jak każda nowa technologia, niesie ze sobą zarówno obietnice, jak i wyzwania. Kluczowe będzie odpowiednie zarządzanie ryzykiem oraz dalsze doskonalenie możliwości AI, aby sprostała ona wymaganiom współczesnych użytkowników i firm.