Разработка ПО для поиска специфических генов в неаннотированных геномах и метагеномах на примере комплекса симбиотических генов азот-фиксаторов

К настоящему моменту разработано множество инструментов, позволяющих находить гомологичные последовательности в данных высокопроизводительных секвенирований. Эвристические алгоритмы, типичным представителем которых является BLAST, демонстрируют высокую скорость работы, но имеют неспецифическую статистическую модель, определяющую достоверность обнаруженной гомологии, что особенно важно при поиске эволюционно далеких последовательностей. В то же время, наиболее прогрессивные и чувствительные алгоритмы, основанные на скрытых моделях Маркова, плохо адаптированы для больших объемов неаннотированных последовательностей ДНК. В данном проекте предполагается разработка дополнительной утилиты для популярной программы HHMER с целью увеличения эффективности работы этого приложения с нуклеотидными последовательностями. В качестве модели для разработки выбран комплекс симбиотических генов клубеньковых бактерий (ризобий). Общее количество симбиотических генов ризобий составляет около 100.  Аннотация типичных ризобиальных геномов (роды Rhizobium, Bradyrhizobium, Mezorhizobium, Sinorhizobium и др.), как правило, не представляет особой сложности. Однако в результате широкомасштабных исследований последнего времени выявлен целый ряд микроорганизмов, фиксирующих азот в симбиозе с бобовыми растениями, но, на первый взгляд, лишенных некоторых важных симбиотических генов, что и порождает интерес к использованию более чувствительных подходов.

 
Студент:
   Илья Корвиго
Куратор:
   Евгений Андронов
Время выполнения проекта: Feb 2015 — Jun 2015
Файлы:
   karimov_040415.pdf