Пайплайн для совмещения данных о топологически ассоциированных доменах ДНК с данными о характерных сочетаниях геномных маркеров

Проект выполняется в рамках подготовки магистерской диссертации в СПбАУ РАН по направлению "Алгоритмическая биоинформатика". Дата защиты: июнь 2015 года.


В настоящей работе представлен метод сопоставления устойчивых сочетаний геномных и эпигенетических маркеров (модификаций гистонов и сайтов связывания транскрипционных факторов) с границами топологически ассоциированных доменов хроматина, осуществлена автоматизация обработки данных, полученных методом Hi-C, с целью выделения границ топологически ассоциированных доменов, а также частичная автоматизация обработки данных, полученных методом ChIP-Seq, с целью нахождения устойчивых сочетаний маркеров. Скрипты, реализующие указанные сопоставление и автоматизацию, доступны в репозитории на портале GitHub под лицензией GNU GPL версии 2 и выше (https://github.com/sidorov-si/TADStates). Практическая применимость разработанных программных средств была подтверждена при обработке данных Hi-C и ChIP-Seq по эмбриональным стволовым клеткам человека (клеточная линия H1-hESC). Удалось выделить устойчивые сочетания маркеров, характерные для разных типов границ между топологически ассоциированными доменами. Одно из выделенных сочетаний представляет особый интерес и нуждается в дальнейшем изучении

Студент:
   Святослав Сидоров
Куратор:
   Александр Предеус
Время выполнения проекта: Sep 2014 — Jun 2015