Search of large-scale deletions in target-sequenced NGS data
В данной работе описывается алгоритм детекции делеций в данных, полученных при помощи таргетного секвенирования генов CFTR, PAH, GALT. Главной целью работы была разработка алгоритма для детектирования гетерозигот по делециям в этих генах. Используем обучение, линейную регрессию, кластеризацию по попарным корреляциям при помощи известных формул.
Вход: данные NGS полученные при помощи IonTorrent 454. Выход: потенциальные гетерозиготы/гомозиготы по делециям с указанием величины отклонения от модели, количества случаев отклонения от модели в данном ампликоне, данных о ближайших соседях.
Время выполнения проекта:
Sep 2013 — Dec 2013