Анализ данных полноэкзомного секвенирования

Полноэкзомное секвенирование - важная альтернатива полногеномному секвенированию для молекулярной диагностики наследственных патологий из-за более низкой цены и большего покрытия клинически важных участков генома. Анализ данных полноэкзомного секвенирования состоит из нескольких этапов: предварительная обработка сиквенсных прочтений, определение вариантов и их клиническая интерпретация. На каждом из этапов необходим контроль качества. 

Основной целью нашей работы являлся анализ данных экзомного секвенирования образцов, полученных от пациентов с эндокринологическими заболеваниями. В рамках работы, мы произвели контроль качества приготовления экзомных библиотек и сделали выбор в пользу набора Roche MedExome для проведения экзомного обогащения. Для вычислительной обработки данных, нами был построен пайплайн на основе программных пакетов Genome Analysis ToolKit, Picard tools и bwa. Также, мы разработали метрику для эффективного ранжирования вариантов, полученных в результате обработки. Данная метрика учитывает предсказания эффекта варианта, его частоту в исследуемой когорте и референсных базах данных. Мы применили наш пайплайн для обработки 120 образцов, для некоторых из них были найдены и подтвержены патогенные варианты, ответственные за развитие заболевания. 

Суммируя выше сказанное, нами был отлажен процесс обработки образца от приготовления библиотеки до интепретации полученных данных. Разработанный нами протокол поможет в проведении молекулярной диагностики наследственных заболеваний.

Студент:
   Юрий Барбитов
Куратор:
   Андрей Глотов
Время выполнения проекта: Feb 2016 — May 2016
Файлы:
   barbitov_28052016.pdf