Amazon Web Services (AWS), czyli dział chmury obliczeniowej Amazona, od niemal dekady konsekwentnie rozwija platformę SageMaker, która umożliwia tworzenie, trenowanie i wdrażanie modeli sztucznej inteligencji (AI). W ostatnich latach priorytetem było wzbogacanie funkcjonalności SageMaker, jednak na tegorocznej konferencji re:Invent 2024 AWS postawiło na uproszczenie obsługi i integrację dotychczas dostępnych rozwiązań. Rezultatem tych działań jest SageMaker Unified Studio – kompleksowe środowisko pracy z danymi, stworzone z myślą o potrzebach nowoczesnych organizacji.
Wszechstronne zarządzanie danymi w jednej platformie
SageMaker Unified Studio to nowa odsłona platformy, która łączy w sobie narzędzia z różnych usług AWS, w tym znanego już wcześniej SageMaker Studio. Dzięki tej integracji użytkownicy zyskują jedno miejsce do odkrywania, przygotowywania i przetwarzania danych, co znacząco ułatwia budowanie modeli AI. Jak tłumaczy Swami Sivasubramanian, wiceprezes ds. danych i AI w AWS: „Obserwujemy konwergencję analityki i sztucznej inteligencji, gdzie klienci wykorzystują dane w coraz bardziej zintegrowany sposób. Nowa generacja SageMaker zapewnia wszystkie niezbędne narzędzia do przetwarzania danych, tworzenia i trenowania modeli oraz generatywnej AI – bezpośrednio w ramach SageMaker.”
Nowy interfejs pozwala nie tylko na efektywne zarządzanie danymi, ale także na publikowanie i udostępnianie modeli, aplikacji czy innych artefaktów w obrębie zespołu lub całej organizacji. SageMaker Unified Studio oferuje również szerokie możliwości zarządzania bezpieczeństwem danych i dostępem, a także integracje z innymi narzędziami AWS, jak na przykład Bedrock – platformą do rozwijania modeli AI.
Wsparcie AI w codziennych zadaniach
Jedną z kluczowych nowości w SageMaker Unified Studio jest integracja z chatbotem Q Developer, który działa jako asystent kodowania. Dzięki niemu użytkownicy mogą formułować pytania, takie jak „Jakie dane powinienem wykorzystać, aby lepiej zrozumieć sprzedaż produktów?” lub „Wygeneruj SQL do obliczenia całkowitego przychodu według kategorii produktów”. AWS podkreśla, że Q Developer wspiera takie zadania jak odkrywanie danych, generowanie kodu, tworzenie zapytań SQL czy integracja danych, co pozwala na szybszą i bardziej intuicyjną pracę nad projektami AI.
Rozszerzenia ekosystemu SageMaker
Obok SageMaker Unified Studio, AWS ogłosiło dwie nowe funkcje w rodzinie produktów SageMaker: SageMaker Catalog oraz SageMaker Lakehouse. SageMaker Catalog to narzędzie umożliwiające administratorom definiowanie i wdrażanie polityk dostępu dla aplikacji AI, modeli, narzędzi i danych w ramach jednej, spójnej struktury uprawnień. Dzięki temu łatwiej kontrolować, kto i w jaki sposób może korzystać z zasobów organizacji.
Z kolei SageMaker Lakehouse zapewnia bezproblemowe połączenia pomiędzy SageMaker a danymi przechowywanymi w jeziorach danych, hurtowniach danych oraz aplikacjach biznesowych. Co istotne, narzędzie to obsługuje dowolne inne rozwiązania zgodne ze standardami Apache Iceberg – popularnym otwartoźródłowym formatem do zarządzania dużymi tabelami analitycznymi. Administratorzy mogą wprowadzać polityki dostępu do danych na poziomie wszystkich narzędzi analityki i AI, które współpracują z Lakehouse.
Lepsza integracja z zewnętrznymi aplikacjami
W odpowiedzi na potrzeby użytkowników, AWS wzbogaciło SageMaker o lepsze integracje z aplikacjami typu software-as-a-service (SaaS). Teraz dane z popularnych platform, takich jak Zendesk czy SAP, mogą być bezpośrednio dostępne w SageMaker, bez konieczności wcześniejszego wyodrębniania, przekształcania czy ładowania ich ręcznie. To ogromne usprawnienie, które pozwala firmom unifikować dane pochodzące z wielu źródeł i wykorzystywać je w celach analitycznych, uczenia maszynowego czy generatywnej AI.
Nowy rozdział w analizie danych i sztucznej inteligencji
SageMaker Unified Studio i powiązane narzędzia to odpowiedź AWS na rosnące wymagania organizacji względem analizy danych i sztucznej inteligencji. Dzięki tym innowacjom, klienci mają możliwość korzystania z ulubionych narzędzi analitycznych i AI, niezależnie od miejsca i formatu przechowywania danych. Jak podkreśla AWS: „Klienci często mają dane rozproszone w wielu jeziorach danych oraz hurtowniach i potrzebują prostego sposobu na ich zintegrowanie. Teraz mogą wykorzystać swoje ulubione narzędzia analityczne i uczenia maszynowego, wspierając różnorodne zastosowania, od analityki SQL, przez ad-hoc querying, aż po generatywną AI.”
Wprowadzenie SageMaker Unified Studio oraz poszerzenie funkcjonalności SageMaker to krok w kierunku jeszcze lepszej unifikacji narzędzi AI i analityki danych w środowisku biznesowym. To rozwiązanie, które bez wątpienia przyczyni się do zwiększenia efektywności i konkurencyjności firm, które zdecydują się na jego wykorzystanie.