Najnowsze badanie opublikowane w czasopiśmie Nature Medicine przedstawia SleepFM — multimodalny model bazowy uczony na danych z polisomnografii (PSG), zaprojektowany do przewidywania ryzyka chorób wiele lat przed ich klinicznym rozpoznaniem. Autorzy analizowali sygnały fizjologiczne z nocnych badań snu, pokazując, że zapis ze snu zawiera subtelne wzorce związane z późniejszym wystąpieniem licznych schorzeń oraz z ryzykiem zgonu.
Dlaczego sen może być wczesnym wskaźnikiem chorób
Zaburzenia snu dotyczą milionów osób i coraz częściej traktowane są nie tylko jako problem sam w sobie, lecz także jako potencjalny wskaźnik lub czynnik ryzyka innych chorób. Polisomnografia to „złoty standard” diagnostyki snu — rejestruje wiele rodzajów sygnałów fizjologicznych przez całą noc, oferując bogate dane, które do tej pory były w dużej mierze niepełnie wykorzystywane przez algorytmy uczenia maszynowego. Wiele wcześniejszych prac koncentrowało się na pojedynczych chorobach lub ograniczonym zestawie wskaźników snu; SleepFM ma na celu wykorzystanie pełnej złożoności sygnałów PSG do bardziej uniwersalnej oceny ryzyka zdrowotnego.
Jak zbudowano i oceniono SleepFM
Model SleepFM powstał na podstawie danych z czterech kohort: BioSerenity, Outcomes of Sleep Disorders in Older Men (MrOS), Multi-Ethnic Study of Atherosclerosis (MESA) oraz Stanford Sleep Clinic (SSC). Łącznie autorzy wykorzystali dane od około 65 000 uczestników obejmujące około 585 000 godzin nagrań snu. Dodatkowo do testów transferu i generalizacji użyto zbioru Sleep Heart Health Study (SHHS), który został wyłączony z etapu wstępnego uczenia modelu.
Wstępne uczenie przeprowadzono w trybie samonadzorowanym z wykorzystaniem celu kontrastowego; po tej fazie oceniano reprezentacje wyuczone przez SleepFM poprzez dopasowanie (fine-tuning) na czterech zadaniach odniesienia: klasyfikacja płci, klasyfikacja faz snu, estymacja wieku oraz klasyfikacja bezdechu sennego. Takie podejście pozwala modelowi nauczyć się ogólnych wzorców z dużej ilości danych, a następnie wykorzystać je do konkretnych zastosowań diagnostycznych.
Wyniki w zadaniach odniesienia
W estymacji wieku SleepFM osiągnął średni błąd bezwzględny (MAE) równy 7,33 roku, z lepszą dokładnością w grupach dziecięcych i osób w średnim wieku oraz większym błędem u seniorów. W klasyfikacji płci model uzyskał pole pod krzywą ROC (AUROC) 0,86 oraz pole pod krzywą precyzja–czułość 0,90. W zadaniu rozróżniania faz snu SleepFM dobrze radził sobie z wykrywaniem stanu czuwania, stadium 2 i fazy REM, natomiast miał większe trudności z fazami przejściowymi, takimi jak stadium 1 — co odpowiada znanej zmienności między oceniającymi wynikami polisomnografii. W porównaniu z wyspecjalizowanymi modelami do oznaczania faz snu (m.in. U-Sleep, GSSC, YASA, STAGES) SleepFM osiągał konkurencyjne wyniki, choć w niektórych zewnętrznych zbiorach dane wyspecjalizowane modele czasami wypadały lepiej. W klasyfikacji bezdechu sennego model osiągnął dokładności 0,87 dla wykrycia obecności i 0,69 dla oceny nasilenia choroby.
Przewidywanie chorób i wyników klinicznych na podstawie nocnych nagrań
Aby ocenić potencjał prognostyczny, badacze połączyli dane ze Stanford Sleep Clinic z elektronicznymi dokumentacjami medycznymi (kody diagnostyczne i daty). Kody te odwzorowano na hierarchiczny system ponad 1 800 kategorii chorób używany w analizach fenomowych (phecodes); po odfiltrowaniu rzadkich zdarzeń i spełnieniu wymogów czasowych pozostawiono 1 041 phecodów do oceny. Jako przypadki definiowano diagnozy postawione później niż siedem dni po badaniu snu, aby uniknąć prostych, retrospektywnych korelacji.
SleepFM uzyskał wysoką jakość predykcji w wielu obszarach. Dla chorób neurodegeneracyjnych model osiągnął AUROC 0,93 dla choroby Parkinsona oraz 0,84 dla opóźnień rozwojowych i łagodnych zaburzeń poznawczych, ocenianych w oknie predykcyjnym wynoszącym sześć lat. W chorobach układu krążenia model skutecznie przewidywał m.in. krwotok wewnątrzczaszkowy (AUROC 0,82) oraz nadciśnieniową chorobę serca (AUROC 0,88) w tym samym, sześciolatnim oknie. W obszarze nowotworów SleepFM dobrze prognozował m.in. raka prostaty, czerniaki oraz raka piersi.
Generalizacja i transfer możliwości
Badacze sprawdzili, jak model zachowuje się przy różnicach czasowych i między ośrodkami. W ocenie czasowej SleepFM przetestowano na pacjentach ze Stanford zarejestrowanych od 2020 r.; model utrzymał silną predykcyjną moc pomimo krótszego okresu obserwacji. W testach między ośrodkami autorzy wykorzystali zbiór SHHS: z wyodrębnionych osadzeń (embeddings) modelu dokonano fine-tuningu na podzbiorze SHHS, a ponieważ definicje wyników różniły się między miejscami, ocena ograniczyła się do sześciu nakładających się zdarzeń sercowo‑naczyniowych. SleepFM wykazał solidne możliwości transferu, osiągając istotną przewidywalność dla niewydolności serca, udaru i zgonów związanych z chorobami układu krążenia.
Porównanie z podejściami nadzorowanymi
Model porównano z dwiema liniami odniesienia: demograficzną (uczono model na cechach strukturalnych takich jak BMI, wiek, płeć, rasa/pochodzenie etniczne) oraz end-to-end modelem trenowanym bez wstępnego uczenia na surowych danych PSG (z uwzględnieniem wieku i płci). Różnica procentowa w AUROC między tymi dwoma bazami a SleepFM mieściła się w przedziale od 5% do 17%, na korzyść SleepFM. Model przewyższał oba podejścia w większości kategorii chorób; w predykcji całkowitej śmiertelności SleepFM osiągnął AUROC 0,85 wobec 0,78 dla obu baz. Ponadto dla ponad 130 warunków model osiągnął indeks Harrella C co najmniej 0,75, co świadczy o mocnej zdolności modelu do rozstrzygania ryzyka w wielu jednostkach chorobowych.
Ograniczenia i perspektywy
Autorzy zastrzegają, że większość danych pochodziła od osób skierowanych na badania snu w warunkach klinicznych, co może ograniczać uogólnialność wyników na populację ogólną. Ponadto, podobnie jak w przypadku innych dużych modeli bazowych, reprezentacje wyuczone przez SleepFM nie są jeszcze w pełni interpretowalne na poziomie konkretnych mechanizmów fizjologicznych — czyli model świetnie „stratyfikuje ryzyko”, ale nie zawsze wyjaśnia, które konkretne zjawiska biologiczne za to odpowiadają.
Mimo tych ograniczeń wyniki sugerują, że analizowanie nocnych sygnałów fizjologicznych za pomocą modeli takich jak SleepFM może uzupełniać istniejące narzędzia oceny ryzyka, oferując wczesne wskazówki o podwyższonym ryzyku wielu chorób. Kolejne badania powinny sprawdzić, czy połączenie modeli snu z danymi z dokumentacji medycznej, obrazowaniem czy omiksem zwiększy ich użyteczność i przełożenie na praktykę kliniczną.
Referencja: Thapa R, Kjaer MR, He B, et al. (2026). A multimodal sleep foundation model for disease prediction. Nature Medicine. DOI: https://doi.org/10.1038/s41591-025-04133-4.

