Mówi się, że przyszłość technologii leży w sztucznej inteligencji, a zespół naukowców z Dana-Farber Cancer Institute, The Broad Institute of MIT i Harvard, Google oraz Uniwersytetu Columbia właśnie to udowodnił. Udało im się opracować model sztucznej inteligencji, nazywany EpiBERT, zdolny przewidywać, które geny są aktywne w dowolnym typie ludzkich komórek. Inspiracją dla tego projektu był model BERT wykorzystywany do przetwarzania i generowania ludzkiego języka, co czyni całe przedsięwzięcie jeszcze bardziej fascynującym.
EpiBERT został stworzony przy użyciu zaawansowanych technik uczenia maszynowego i trenuje się na ogromnych zbiorach danych genomowych. Model wykorzystuje sekwencje DNA, które składają się z 3 miliardów par zasad, oraz mapy dostępności chromatyny – elementy kluczowe do zrozumienia, które fragmenty DNA są odczytywane przez komórki. Proces ten pozwala na określenie, jakie geny są aktywne w danym typie komórki. Dzięki temu sztuczna inteligencja identyfikuje regulatory genetyczne, czyli fragmenty genomu, które kontrolują ekspresję genów. Jest to niczym budowa gramatyki języka genetycznego, podobnie jak modele językowe uczą się konstruować sensowne i spójne zdania, analizując ogromne ilości tekstu.
Dzięki EpiBERT możliwe jest przewidywanie aktywności genów w komórkach nigdy wcześniej niebadanych. To niezwykłe osiągnięcie może znaleźć zastosowanie w zrozumieniu mechanizmów regulacyjnych genów w różnych typach komórek oraz ich mutacji, które prowadzą do powstania chorób, takich jak nowotwory. Jest to przełom, który otwiera drzwi do bardziej precyzyjnej diagnostyki oraz spersonalizowanego leczenia w przyszłości.
Kluczowym elementem każdego organizmu jest to, że wszystkie jego komórki posiadają identyczną sekwencję genomu. Różnice między komórkami wynikają nie z tego, jakie geny są obecne, lecz z tego, które z nich są w danym momencie aktywowane i w jakim stopniu. Niemniej jednak, blisko 20% genomu odpowiada za elementy regulacyjne, które decydują o aktywacji genów. Problem w tym, że niewiele wiadomo na temat lokalizacji tych elementów, ich funkcji czy wpływu mutacji na ich działanie. EpiBERT rzuca światło na te procesy i oferuje nadzieję na lepsze zrozumienie tajemnic genomiki.
Tak zaawansowane badania nie byłyby możliwe bez odpowiedniego wsparcia finansowego i technologicznego. Projekt wsparły instytucje takie jak Broad Institute, Novo Nordisk Foundation i National Genome Research Institute, a także fundusze prywatne, m.in. Sharf Green Cancer Research Fund i Richard and Nancy Lubin Family. Partnerem technologicznym było Google, które udostępniło swoje jednostki TPU (Tensor Processing Units) dla potrzeb obliczeniowych projektu.
Rozwój takich technologii jest zapowiedzią nowej ery, w której sztuczna inteligencja staje się nie tylko narzędziem, ale i partnerem naukowców, pozwalającym na lepsze zrozumienie biologii człowieka. Potencjał EpiBERT-u wykracza daleko poza genomikę – niesie obietnicę rewolucji w medycynie, diagnostyce i terapii przyszłości.