Разработка алгоритма предсказания локального происхождения
Существуют наследственные заболевания, присущие определённым человеческим популяциям (народностям, племенам). При этом в процессе географического распространения человека и слияния популяций возникают индивиды, имеющие смешанное происхождение. Изза множественных рекомбинаций их геномы представляют собой мозаику из оригинального генофонда их предков. Риск наследственного заболевания у такого индивида определяется тем, аллель из какой популяции соответствует гену, непосредственно связанному с заболеванием. Несмотря на то, что существуют алгоритмы определения процентного содержания аллелей референсных популяций в геноме индивида, они не позволяют определить географическое происхождение аллели конкретного гена. При этом наличие такой информации о человеке для каждого локуса может помочь при оценке рисков заболеваний и подборе методов лечения. Возникает задача — найти географическое/этническое происхождение каждого геномного локуса.
Разработка алгоритма, позволяющего решать поставленную задачу, состоит из трёх этапов:
- Исследовать различные подходы к разметке генома, такие как использование карты известных гаплотипов или разметка скользящим окном различных размеров.
- Применить существующий алгоритм GPS для определения происхождения каждого геномного участка.
- Слияние регионов одинакового географического происхождения.
Такой алгоритм является версией алгоритма GPS, работающей на уровне локального происхождения (GPSL).