Ponad dekadę temu zainicjowano BabySeq Project – pilotażowy program mający na celu udostępnienie wyników sekwencjonowania genomowego noworodków ich rodzicom oraz ocenę wpływu tych informacji na opiekę medyczną. Od tego czasu podobne inicjatywy zyskują coraz większe zainteresowanie na całym świecie. Obecnie ponad 30 międzynarodowych programów bada możliwości rozszerzenia badań przesiewowych noworodków (NBSeq) za pomocą technologii genomowych. Jednakże najnowsze badania przeprowadzone przez naukowców z Mass General Brigham unaoczniają znaczne rozbieżności w doborze genów w różnych programach. Opublikowana w czasopiśmie „Genetics in Medicine” analiza wskazuje na potrzebę ujednolicenia podejścia do wyboru genów poprzez zastosowanie metod opartych o dane i sztuczną inteligencję.
Autorzy badania opracowali model uczenia maszynowego, który pozwala uporządkować i ustandaryzować proces wyboru genów do badań przesiewowych noworodków na poziomie genomowym. To pierwsza publikacja Międzynarodowego Konsorcjum Sekwencjonowania Noworodków (ICoNS), powołanego w 2021 roku przez dr. Roberta C. Greena – dyrektora programu badawczego Genomes2People w Mass General Brigham – oraz dr. Davida Bicka z Genomics England w Wielkiej Brytanii.
W ramach analizy, naukowcy przyjrzeli się aż 4 390 genom uwzględnianym przez 27 programów NBSeq na świecie. Zaskakującym wynikiem było to, że jedynie 74 geny – czyli zaledwie 1,7% z całkowitej liczby – pojawiały się w ponad 80% programów. Najsilniejszymi predyktorami obecności danego genu w badaniu były następujące czynniki: czy dana jednostka chorobowa znajduje się na standardowej liście badań przesiewowych zalecanej w USA (Recommended Uniform Screening Panel), obecność solidnych danych dotyczących naturalnego przebiegu choroby, a także istnienie przekonujących dowodów na skuteczność leczenia.
Na podstawie zebranych danych badacze stworzyli model uczenia maszynowego wykorzystujący 13 kluczowych predyktorów, który z dużą dokładnością przewiduje, które geny powinny znaleźć się w programach NBSeq. Co istotne, model ten jest elastyczny i może być aktualizowany w miarę pojawiania się nowych danych czy różnic regionalnych, co czyni z niego bardzo użyteczne narzędzie dla decydentów oraz klinicystów pracujących nad wdrażaniem tych programów w różnych częściach świata.
Według dr Greena, to przełomowe badanie stanowi istotny krok w kierunku harmonizacji programów sekwencjonowania noworodków na świecie. Dzięki zastosowaniu nowoczesnych metod analitycznych i uczenia maszynowego możliwe staje się nie tylko ujednolicenie wyboru genów, ale również lepsze dostosowanie programów do aktualnych priorytetów zdrowia publicznego oraz najnowszej wiedzy naukowej.
Rozwój technologii sekwencjonowania genomowego i coraz większa precyzja w analizie genów otwierają nowe możliwości dla medycyny przyszłości. Inicjatywy takie jak ta wskazują na rosnącą potrzebę stworzenia spójnych, opartych na danych protokołów dla badań przesiewowych u najmłodszych pacjentów. Dzięki temu możliwe będzie nie tylko wcześniejsze wykrywanie chorób genetycznych, ale również skuteczniejsze ich leczenie i poprawa jakości życia od najmłodszych lat.