Разработка алгоритма предсказания локального происхождения

Существуют наследственные заболевания, присущие определённым человеческим популяциям (народностям, племенам). При этом в процессе географического распространения человека и слияния популяций возникают индивиды, имеющие смешанное происхождение. Из­за множественных рекомбинаций их геномы представляют собой мозаику из оригинального генофонда их предков. Риск наследственного заболевания у такого индивида определяется тем, аллель из какой популяции соответствует гену, непосредственно связанному с заболеванием. Несмотря на то, что существуют алгоритмы определения процентного содержания аллелей референсных популяций в геноме индивида, они не позволяют определить географическое происхождение аллели конкретного гена. При этом наличие такой информации о человеке для каждого локуса может помочь при оценке рисков заболеваний и подборе методов лечения. Возникает задача — найти географическое/этническое происхождение каждого геномного локуса.

Разработка алгоритма, позволяющего решать поставленную задачу, состоит из трёх этапов:

  1. Исследовать различные подходы к разметке генома, такие как использование карты известных гаплотипов или разметка скользящим окном различных размеров.
  2. Применить существующий алгоритм GPS для определения происхождения каждого геномного участка.
  3. Слияние регионов одинакового географического происхождения.

Такой алгоритм является версией алгоритма GPS, работающей на уровне локального происхождения (GPS­L).

Студент:
   Иван Дмитриевский
Время выполнения проекта: Feb 2016 — May 2016