BI project

Анализ ошибок в чтениях, полученных в результате секвенирования технологий Ion Torrent

Для ридов, получаемых с помощью Ion Torrent, характерны ошибки вставки-удаления (инделы). Чтение идет по гомополимерам, и информация о длине приходит в виде сигнала, из-за чего она определяется неточно. Чем длиннее гомополимеры, тем хуже распознается их длина. Такие ошибки приводят к сдвигам в выравнивании.
В работе рассмотрено использование скрытых марковских моделей для имитации процесса чтения строк из гомополимеров. Реализованы алгоритмы для оценки параметров такой модели.

Определение копийности контигов больших геномов

Задача определения вариации числа копий (CNV) имеет большое значение так как подтверждена связь CNV с течением множества заболеваний. Это такие заболевания как рак груди, синдром Альцгеймера, шизофрения, синдром Прадера-Вилли и синдром Ангельмана. Более того, сейчас существуют гипотезы о том, что  не только CNV генов, но и CNV повторов в человеческом организме связаны с некоторыми заболеваниями. Данная задача в свою очередь связана с задачей определения копийности контигов, а копийность контигов с количеством путей через вершины стрингграфа.

Разработка ПО для поиска специфических генов в неаннотированных геномах и метагеномах на примере комплекса симбиотических генов азот-фиксаторов

К настоящему моменту разработано множество инструментов, позволяющих находить гомологичные последовательности в данных высокопроизводительных секвенирований. Эвристические алгоритмы, типичным представителем которых является BLAST, демонстрируют высокую скорость работы, но имеют неспецифическую статистическую модель, определяющую достоверность обнаруженной гомологии, что особенно важно при поиске эволюционно далеких последовательностей.

Глубокий анализ ошибок сборки

Результат работы геномного ассемблера всегда содержит в себе ошибки. Задачей данного проекта являлась автоматизация процесса поиска ошибок и анализа причин их возникновения. В итоге была разработана утилита для фильтрации ложно определенных ошибок и анализа и удобного представления настоящих ошибок сборки.
 

Анализ встречаемости мутаций в гене ABCA4 на примере болезни Штаргардтав популяции РФ и СНГ

Данный проект был посвящён описанию мутаций, приводящих к наследственной дистрофии сетчатки, у пациентов популяции европейской части России. Дистрофия сетчатки - заболевание, связанное с нарушением сетчатки – оболочки глаза, в которой расположены фоторецепторы.

Эволюция геномов бактерий рода Lactobacillus

Lactobacillus — род грам-положительных факультативно анаэробных бактерий. Они являются  одними из важнейших в группе молочнокислых бактерий, большинство членов которой превращают лактозу и другие углеводы в молочную кислоту. Сравнение геномов редставителей данного рода может позволить выявить структурные изменения генома при ведении симбиотического существования. В ходе нашего исследования мы хотели изучить эволюцию как целых геномов, так и отдельных генов и сравнить их. 

Объединение моделей аннотации генов и коррекция аннотации

Есть множество способов аннотации генов в геноме, но пока нет единственного правильного; каждый из подходов обладает как плюсами, так и минусами. В разное время было предпринято несколько попыток создания программ для объединения аннотаций. В ходе этой работы мы на примере генома нового штамма хорошо изученного вида сравнили как de novo (GeneMark, Augustus, SNAP), так и основанные на гомологии (liftOver,  Exonerate) подходы к аннотации генов.

Продвинутый анализ антител

Antibodies undergo multiple changes that lead to extreme diversity of entire repertoire. These changes are described as several somatic processes: V(D)J recombination (including endonuclease removals and insertion of N-nucleotides) and hypermutations. Even though somatic processes look random, latest works about analysis of TCR repertoire (other components of immune system) showed some patterns of diversity mechanisms. Present project is dedicated to detail analysis of antibodies repertoire based on datasets provided by Genentech.

Сборка скаффолдов на основе анализа геномных перестроек

Проект выполняется в рамках подготовки магистерской диссертации в СПбАУ РАН по направлению "Алгоритмическая биоинформатика". Дата защиты: июнь 2015 года.

Pages

Subscribe to RSS - BI project