W wieloletniej pracy w obszarze nauk przyrodniczych jedno pytanie pojawia się najczęściej: co dalej z AI w naszej dziedzinie? Odpowiedź nie jest trywialna — branża life sciences operuje na ogromnych, nieuporządkowanych zbiorach danych: raportach z badań klinicznych, wynikach laboratoryjnych, publikacjach naukowych czy dokumentacji medycznej pacjentów. Błąd interpretacyjny to nie tylko strata czasu — to potencjalny wpływ na bezpieczeństwo, skuteczność terapii i wynik pacjentów. Dlatego prawdziwa wartość generatywnej sztucznej inteligencji (GenAI) w tym obszarze leży nie tyle w interaktywnych czatbotach, co w możliwości precyzyjnego, głębokiego wyszukiwania i łączenia rozproszonych źródeł danych.
Przykład ilustruje skalę wyzwania: prośba o „znalezienie badań klinicznych dotyczących raka jelita grubego z zastosowaniem leku ZALTRAP z najnowszymi publikacjami potwierdzającymi” wymaga jednoczesnego przeszukania różnych baz, wyrównania terminologii i oceny aktualności dowodów. Sukces polega na tym, by system potrafił zintegrować te rozproszone informacje i wyciągnąć wnioski, które badaczowi trudno byłoby połączyć ręcznie.
Od tradycyjnego wyszukiwania do odkryć napędzanych przez AI
Przez dekady wyszukiwanie w naukach przyrodniczych opierało się głównie na wyszukiwaniu słów kluczowych lub regułach. Takie podejście sprawdzało się przy prostych zapytaniach, ale szybko napotykało ograniczenia w obliczu specyficznego języka dziedziny, synonimów oraz złożonych relacji między chorobami, molekułami i szlakami biochemicznymi. W praktyce oznaczało to ciągłe ręczne dopracowywanie zapytań i żmudne składanie zebranych fragmentów informacji w całość.
Wprowadzenie dużych modeli językowych (LLM) i GenAI zmienia tę dynamikę, ponieważ te systemy rozumieją znaczenie, a nie tylko zgodność słów. Dzięki temu możliwe jest zadawanie złożonych pytań w naturalnym języku i otrzymywanie wyników, które łączą rozproszone dane z literatury, rejestrów badań i patentów, nawet gdy różne źródła używają odmiennych terminów. To otwiera nowe możliwości: od odkrywania pomysłów na ponowne zastosowanie leków, przez przyspieszanie identyfikacji biomarkerów, po ujawnianie wcześniej niewidocznych zależności między elementami biologicznymi.
Możesz zadawać złożone pytania w języku naturalnym i otrzymywać wyniki, które łączą elementy z literatury, badań klinicznych i patentów — nawet gdy używają różnych terminów.
Dlaczego tensory mają znaczenie
Dane w life sciences występują w bardzo różnorodnych postaciach — od danych „omics”, przez trójwymiarowe struktury białek, obrazy medyczne, aż po dokumenty regulacyjne i raporty kliniczne. Wiele z tych danych jest nieustrukturyzowanych lub półstrukturalnych, co utrudnia szybkie i precyzyjne odnajdywanie korelacji. W takim kontekście „wystarczające” rozwiązania nie istnieją — wymagana jest wysoka dokładność.
Tutaj wchodzą tensory. W najprostszej analogii wektor to jednowymiarowa lista liczb, macierz to układ dwuwymiarowy, a tensor to uogólnienie na wiele wymiarów naraz. Dzięki temu tensor może uchwycić złożone relacje wielowymiarowe — na przykład przestrzenne relacje w strukturze białka albo kontekstowe powiązania między terminami w artykule naukowym, nawet jeśli występują one daleko od siebie.
Innymi słowy, tensory pozwalają modelom AI „widzieć” i uczyć się wzorców, które są głęboko wplecione w różne wymiary danych.
Tensory w praktyce: struktury białek
Dobrym przykładem są modele predykcyjne struktur białek, takie jak AlphaFold. W tych systemach trójwymiarowe tensory reprezentują przestrzenne relacje pomiędzy aminokwasami, co umożliwia nauce modelu uchwycenie sposobu, w jaki białko się składa, skręca i wchodzi w interakcje — wiedza kluczowa do zrozumienia mechanizmów chorób i projektowania terapii.
Osadzając białko jako tensor, zachowujemy jednocześnie:
- sekwencyjne informacje (kolejność aminokwasów),
- relacje przestrzenne (sposób składania i połączeń fragmentów białka),
- właściwości biochemiczne (np. ładunek czy hydrofobowość).
Dzięki tak bogatej reprezentacji modele ML potrafią przewidywać fałdowanie białek, identyfikować miejsca wiązania, mapować interakcje białko–białko, a także wspierać odkrywanie nowych celów lekowych. Podobne zasady stosuje się poza biochemią: obrazy medyczne mogą być kodowane jako tensory nie tylko z informacją o pikselach, ale i kontekście, co pomaga wykrywać subtelne markery nowotworowe w zaszumionych skanach. W środowiskach klinicznych tensory umożliwiają analizę strumieni danych z urządzeń typu wearables lub IoT w czasie rzeczywistym, wspierając szybsze interwencje.
Obraz: thinkhubstudio na Shutterstock.
AI-agenci: więcej niż wyszukiwarki
Rosnącą rolę odgrywają też tzw. AI-agenci — inteligentne asystenty, które stale gromadzą, analizują i syntetyzują informacje z rozproszonych źródeł. Agent może na przykład monitorować nową literaturę, aktualizacje badań klinicznych i zmiany regulacyjne w czasie rzeczywistym, streszczać istotne ustalenia i sugerować kolejne kroki badawcze.
Dobre agenty nie tylko pobierają informacje — one je łączą, budując kontekst i rozumowanie krok po kroku.
Kluczowa jest tu wieloetapowa analiza: agent nie ogranicza się do jednego zapytania, lecz łączy wiele kroków rozumowania, by zbudować kompletny obraz. Dzięki tensoryzacji można spajać dane multimodalne i zadawać pytania obejmujące różne typy informacji oraz horyzonty czasowe. Przykładowo, rekrutacja pacjentów do badania może opierać się na analizie progresji choroby w czasie, łącząc w jednym tensorze kartę pacjenta, wyniki badań biomarkerowych, skany histopatologiczne i notatki prognostyczne — co znacznie ułatwia identyfikację odpowiednich kandydatów.
Co z tego wynika
Dane w life sciences stają się coraz bardziej złożone i obszerne, co przekracza możliwości tradycyjnych narzędzi. Tensory tworzą fundament dla modeli AI zdolnych poradzić sobie z tą złożonością — od lepszego wyszukiwania informacji, przez zaawansowane wnioskowanie, aż po działające w praktyce AI-agenty, które odciążają badaczy od żmudnego przygotowania danych. Dzięki temu naukowcy mogą skupić się na odkrywaniu i projektowaniu terapii, zamiast na ręcznym scalaniu rozproszonych źródeł.
Autorka: Harini Gopalakrishnan. Harini kieruje praktyką life sciences w Vespa.ai, jest strategiem technologicznym z doświadczeniem w AI, platformach danych i transformacji cyfrowej w sektorze farmaceutycznym i biotechnologicznym; wcześniej pełniła funkcję Global CTO dla life sciences w Snowflake.
Data publikacji: 25 sierpnia 2025.

