SAP SE, niemiecki dostawca oprogramowania dla biznesu, podczas odbywającej się w Berlinie konferencji TechEd przedstawił swój pierwszy model bazowy skoncentrowany na danych relacyjnych — SAP‑RPT‑1. Firma zapowiada, że model stanie się ogólnie dostępny jeszcze w tym roku i będzie oferowany w wersjach małej oraz większej (dokładne rozmiary nie zostały ujawnione). Równocześnie SAP udostępnił model o otwartych wagach na platformie Hugging Face.
SAP określa SAP‑RPT‑1 jako „pierwszy przedsiębiorczy relacyjny model bazowy”, ponieważ zaprojektowano go natywnie do pracy ze strukturami tabelarycznymi i danymi relacyjnymi, które dominują w systemach biznesowych. Zamiast przewidywać kolejne słowo w tekście, jak klasyczne duże modele językowe, RPT‑1 skupia się na przewidywaniu wyników typowych scenariuszy biznesowych — klasyfikacji i regresji na danych tabelarycznych.
Nazwa RPT (wym. „rapid”) to skrót od „relational pre‑trained transformer”. Zespół badawczy SAP wcześniej opublikował obszerne opracowanie pod nazwą ConTextTab — to właśnie ten projekt przekształcono w SAP‑RPT‑1. W procesie treningu modelu o otwartych wagach wykorzystano zestaw danych Tremendous TabLib Trawl (T4), zawierający około 1,34 TB danych rozłożonych w około 3,1 miliona tabel obejmujących różne dziedziny, od danych sportowych po informacje o emisjach dotyczące litewskich instalacji przemysłowych.
SAP podkreśla, że komercyjna odsłona modelu została dodatkowo wzbogacona o dane z szerszych źródeł, co — jak firma przewiduje — powinno przekładać się na lepsze osiągi w praktycznych zastosowaniach niż wersja otwarta. Dzięki wstępnemu treningowi ukierunkowanemu na dane relacyjne, SAP‑RPT‑1 ma umożliwiać użytkownikom omijanie czasochłonnego procesu dopasowywania (fine‑tuningu) w wielu typowych zadaniach analitycznych.
Bharat Sandhu, Chief Marketing Officer SAP BTP, wyjaśnia, że branża miała lukę w narzędziach: klasyczne LLM‑y uczone są głównie na ogromnych zbiorach danych nieustrukturyzowanych, przez co świetnie radzą sobie w generowaniu tekstu, ale gorzej z zadaniami wymagającymi „matematycznego” rozumowania nad tabelami. „Problem z tradycyjnym uczeniem maszynowym polega na tym, że trzeba trenować model — potrzebne są dane, trzeba zadbać o uprzedzenia, to wymaga czasu i specjalistycznej wiedzy. RPT‑1 to w zasadzie uniwersalny relacyjny model, który potrafi wykonywać przewidywania, prognozy i inne analizy na danych tabelarycznych” — powiedział Sandhu.
W praktyce SAP‑RPT‑1 oferuje możliwość wykonywania klasyfikacji i regresji nad danymi tabelarycznymi za pomocą prostego wywołania API i mechanizmu in‑context learning, co oznacza, że model potrafi uczyć się na kontekście przekazanych przykładowych wierszy bez konieczności dodatkowego trenowania. To ma uprościć wdrożenie analiz predykcyjnych w przedsiębiorstwach, które dysponują głównie ustrukturyzowanymi danymi.
Aby ułatwić testy i demonstracje, SAP uruchamia również bezpłatne, webowe środowisko SAP‑RPT Playground. Pozwala ono ładować pliki CSV (ograniczenie do maksymalnie 2 073 wierszy i 50 kolumn) i wypróbować standardowe scenariusze, które SAP spodziewa się widzieć w praktyce: prognozowanie potrzeb serwisowych, ocenę ryzyka płatności czy przewidywanie odpływu klientów.
Relacyjne modele bazowe to obecnie aktywny obszar badań i rozwoju — poza dużymi graczami pojawiają się też startupy pracujące w tym obszarze. SAP‑RPT‑1 wpisuje się w tę falę, oferując przedsiębiorstwom rozwiązanie nastawione na realne zastosowania biznesowe i integrację z platformą SAP, przy jednoczesnym udostępnieniu wersji otwartej dla społeczności badawczej i deweloperów.

