Repeat classification in mammalian genomes

Целью проекта было ввести студентов в область изучения природы повторов в человеческом геноме. В качестве введения была предложена задача о поисках target site duplications (TSD), по итогам которой был разработан алгоритм поиска TSD в человеческом геноме и собрано множество статистик. Способность определять TSD может послужить ключом к решению более сложных задач. После этого было предложено еще несколько крупных задач, имеющих практическую ценность и не имеющих общепризнанного подхода к решению. В итоге Олег занялся поиском structural variations в геноме отдельного организма. В настоящее время существует множество подходов по определению вариаций относительно референсного генома, однако есть цель разработать алгоритм для поиска вариаций между почти идентичными геномами. Дима занимается задачей определения CNV повторов в геноме потоковыми методами (которые на данный момент не имеют решения) и участвует в проекте Миши Колмогорова Ragout.

Куратор:
   Son Pham
Время выполнения проекта: Feb 2014 — May 2014