Поиск тандемных повторов в трех геномных сборках китайского хомячка и оценка качества сборки сортированных хромосом

Тандемные повторы составляют значительную часть (десятки процентов) геномов всех высших эукариот и представляют собой основу конститутивного гетерохроматина, из которого состоят такие функционально значимые районы хромосом как центромеры. Тем не менее, этот класс последовательностей ДНК является одним из самых плохо изученных. Применение биоинформатических методов для поиска новых семейств тандемных повторов показало хорошие результаты на примере генома Mus musculus (Komissarov et al.,2011). В настоящей работе сделана попытка поиска тандемных повторов в трех геномых сборках Cricetulus griseus, одна из которых (WGS проект APMK01) сделана на основе сиквенса сортированных хромосом.

В результате работы были найдены около 60 новых семейств больших тандемных повторов, несколько из них являются хорошими кандидатами на роль центромерных тандемных повторов. С помощью анализа тандемных повторов в геномной сборке APMK01 было найдено значительное количество хромосом-специфичных семейств тандемных повторов, что может свидетельствовать о хорошем разделении ДНК хромосом при сортинге.

Время выполнения проекта: Sep 2013 — Dec 2013