Анализ данных полноэкзомного секвенирования
Полноэкзомное секвенирование - важная альтернатива полногеномному секвенированию для молекулярной диагностики наследственных патологий из-за более низкой цены и большего покрытия клинически важных участков генома. Анализ данных полноэкзомного секвенирования состоит из нескольких этапов: предварительная обработка сиквенсных прочтений, определение вариантов и их клиническая интерпретация. На каждом из этапов необходим контроль качества.
Основной целью нашей работы являлся анализ данных экзомного секвенирования образцов, полученных от пациентов с эндокринологическими заболеваниями. В рамках работы, мы произвели контроль качества приготовления экзомных библиотек и сделали выбор в пользу набора Roche MedExome для проведения экзомного обогащения. Для вычислительной обработки данных, нами был построен пайплайн на основе программных пакетов Genome Analysis ToolKit, Picard tools и bwa. Также, мы разработали метрику для эффективного ранжирования вариантов, полученных в результате обработки. Данная метрика учитывает предсказания эффекта варианта, его частоту в исследуемой когорте и референсных базах данных. Мы применили наш пайплайн для обработки 120 образцов, для некоторых из них были найдены и подтвержены патогенные варианты, ответственные за развитие заболевания.
Суммируя выше сказанное, нами был отлажен процесс обработки образца от приготовления библиотеки до интепретации полученных данных. Разработанный нами протокол поможет в проведении молекулярной диагностики наследственных заболеваний.