Поиск однонуклеотидных полиморфизмов штаммов Mycobacterium tuberculosis, распространенных в различных регионах мира

Первый геном Mycobaterium tuberculosis был секвенрован в 1998 году. По результатам многочисленных последующих геномных исследований (а к настоящему моменту секвенировано уже несколько тысяч геномов M. tuberculosis) обнаружили 7 основных географических линий возбудителя туберкулёза. Поиск SNP --  одна из основных задач любой работы по секвенированию M. tuberculosis сегодня. Анализ SNP позволяет решать такие важные в фундаментальном и практическом отношении задачи, как выявление филогеографических закономерностей и связи конкретных мутаций с лекарственной устойчивостью.

Данный проект был направлен на поиск SNP в штаммах M. tuberculosis, изолированных в разных регионах мира, на основании данных из открытых архивов. В основе исследования –пайплайн bowtie2 / samtools , запускаемый серией специально подготовленных скриптов для обработки больших объёмов данных. В качестве референса использовался геном H37Rv. Всего был получен 1101 .vcf файл для изолятов из более 40 стран. Дополнительно отмечалась, при наличии, информация о сполиготипе и лекарственной устойчивости каждого образца.

Полученные результаты позволят проанализировать данные по российским изолятам M. tuberculosis из новой базы данных GMTV (http://mtb.dobzhanskycenter.org) в широком контексте геномных исследований M. tuberculosis. Проект предполагает продолжение, в том числе включение ещё большего объёма данных и аннотацию обнаруженных SNP.

Студент:
   Анна Гончар
Время выполнения проекта: Feb 2014 — May 2014
Файлы:
   gonchar_final_31052014.pdf