Naukowcy stworzyli nowy model sztucznej inteligencji – Evo, który może zrewolucjonizować badania nad DNA, RNA oraz białkami. Evo to model uczenia maszynowego, który potrafi dekodować i projektować sekwencje DNA i RNA na niespotykaną dotąd skalę, od molekularnej aż po genomową. Jego potencjał przewidywania, generowania oraz inżynierii całych sekwencji genomowych może zmienić oblicze biologii syntetycznej, a także przyczynić się do postępu w diagnostyce i terapii chorób. Jak zauważa Christina Theodoris, umiejętność przewidywania skutków mutacji i projektowania sekwencji DNA w celu manipulowania funkcjami komórkowymi mogłaby przynieść ogromne korzyści w kontekście leczenia różnych schorzeń.
DNA jako kod życia
DNA, które składa się zaledwie z czterech nukleotydów, zawiera wszystkie niezbędne informacje genetyczne, które definiują organizmy żywe. Zmiany w sekwencji genomu odzwierciedlają przystosowania do specyficznych funkcji biologicznych i są motorem napędowym ewolucji – to one umożliwiają organizmom adaptację do nowych warunków środowiskowych. Dzięki nowoczesnym technologiom sekwencjonowania DNA, naukowcy mogą obecnie identyfikować wszelkie zmiany w genomie na niespotykaną skalę. Połączenie tych danych z algorytmami sztucznej inteligencji otwiera drzwi do stworzenia kompleksowych modeli, które potrafią lepiej zrozumieć funkcje DNA, RNA oraz białek, a także ich wzajemne oddziaływania.
Jednak dotychczasowe próby modelowania DNA za pomocą algorytmów inspirowanych sukcesem dużych modeli językowych (ang. Large Language Models, LLMs) były ograniczone. Większość obecnych generatywnych modeli koncentruje się jedynie na pojedynczych cząsteczkach lub fragmentach DNA, co utrudnia analizę bardziej złożonych procesów biologicznych na szerszą skalę.
Evo – przełomowy model genomowy
Eric Nguyen wraz z zespołem postanowili przesunąć granice badań i stworzyć Evo – model genomowy o ogromnej skali, mający aż 7 miliardów parametrów, zaprojektowany do generowania sekwencji DNA o długości sięgającej całego genomu. Model Evo opiera się na architekturze StripedHyena i został wytrenowany na zestawie danych zawierającym 2,7 miliona ewolucyjnie zróżnicowanych genomów mikroorganizmów.
Wyniki badania pokazują, że Evo osiąga imponujące wyniki zarówno w zadaniach predykcyjnych, jak i generatywnych. Modele zero-shot, stosowane w ocenie Evo, wykazują wysoką skuteczność w przewidywaniu wpływu mutacji na białka bakteryjne oraz RNA. Evo również doskonale radzi sobie z modelowaniem regulacji genów i uwzględnia złożone współzależności między sekwencjami kodującymi i niekodującymi. Dzięki temu można projektować bardziej skomplikowane systemy biologiczne, takie jak kompleksy CRISPR-Cas czy elementy transpozonowe.
Nowy wymiar generowania sekwencji genomowych
Jedną z kluczowych zalet Evo jest zdolność do generowania długich sekwencji genomowych, sięgających nawet 1 megabazy, co stanowi ogromny krok naprzód w porównaniu z wcześniejszymi modelami. Evo posiada potencjał do zmiany przyszłych badań nad ludzkimi oraz innymi eukariotycznymi genomami, co może otworzyć nowe możliwości w zrozumieniu interakcji genomowych na jeszcze większych skalach.
Zastosowanie Evo w badaniach nad genomem może przynieść istotne korzyści dla nauki, zwłaszcza w kontekście projektowania nowych terapii genetycznych, lepszego zrozumienia chorób dziedzicznych oraz inżynierii biologicznej. Przyszłe modele, oparte na tej technologii, mogą jeszcze bardziej poszerzyć naszą wiedzę na temat genomów i ich funkcji, co wpłynie na rozwój medycyny i biotechnologii.
Podsumowanie
Evo to zaawansowany model sztucznej inteligencji, który ma potencjał do przekształcenia biologii syntetycznej i badań nad DNA. Jego zdolność do dekodowania, przewidywania i projektowania sekwencji genomowych otwiera nowe perspektywy w badaniach nad mutacjami genetycznymi oraz regulacją genów. Evo może być kluczowym narzędziem w przyszłych badaniach genomowych, które będą miały duże znaczenie zarówno dla diagnozy, jak i rozwoju nowych terapii genetycznych.
(Źródło: American Association for the Advancement of Science – AAAS)