Разработка алгоритмов для анализа палео-геномов

Выравнивание ридов, полученных в результате секвенирования древних образцов ДНК, на референс современного организма представляет собой сложную задачу. Одна из основных проблем здесь - это ошибки в древней последовательности ДНК, которые могут быть ошибочно рассмотрены как SNP, и, следовательно, могут привести к искажению результатов. Для того, чтобы избежать такой ситуации, необходимо наличие инструмента, позволяющего оценить вероятность ошибки в древней ДНК. В ходе выполнения проекта сначала была собрана статистика по трём величинам: метилирование, GC контент, количество SNP C->T, а затем произведены попытки построения моделей для описания возможной зависимости между ними, которые, однако, не увенчались особым успехом.

Студент:
   Пётр Леонтьев
Время выполнения проекта: Feb 2015 — Jun 2015
Файлы:
   leontev_30052015.pdf