AU project

Идентификация мутации csa у дрожжей Saccharomyces cerevisiae, необходимой для фенотипического проявления приона [NSI+] на основе имеющихся данных геномного секвенирования

Прионы — это обладающие аномальной третичной структурой и инфекционными свойствами за счет того, что могут катализировать превращение гомологичных им нормально уложенных белков в себе подобные. Все известные прионы вызывают формирование амидлоидов — фибрилярных белковых структур.  Формирование подобных структур в нервной системе вызывает тяжелейшие нейродегенеративные заболевания.Дрожжи являются отличной моделью для изучения прионов, поэтому открытие и идентификация новых дрожжевых прионов представляет большой интерес.

Search for Correlation of Socioeconomic Status and Methylation Profiles

С целью установить, существует ли зависимость профиля метилирования от факта усыновления, был проведен сравнительный анализ метиломов российских сирот, усыновленных резидентами США, соответственно, до и после усыновления (временной промежуток 6 месяцев).

Использование графов для работы с VCF-файлами

В данном проекте были реализованы:

  • возможность агрегирования нескольких vcf-файлов, а так же представления полученной структуры в виде графа с целью оптимизации некоторых алгоритмов и уменьшения размера структуры; 
  • возможность обратной конвертации графа в vcf-файл с описанием сохраненных для указанных хромосом мутаций;
  • конвертация в некоторые другие форматы (dot).

Новый подход для детекции делеций в данных NGS, полученных с использованием мультиплексной ПЦР

Проект выполняется в рамках подготовки магистерской диссертации в СПбАУ РАН по направлению "Алгоритмическая биоинформатика". Предполагаемая дата защиты: июнь 2015 года.

Repeat classification in mammalian genomes

Целью проекта было ввести студентов в область изучения природы повторов в человеческом геноме. В качестве введения была предложена задача о поисках target site duplications (TSD), по итогам которой был разработан алгоритм поиска TSD в человеческом геноме и собрано множество статистик. Способность определять TSD может послужить ключом к решению более сложных задач. После этого было предложено еще несколько крупных задач, имеющих практическую ценность и не имеющих общепризнанного подхода к решению.

Ragout - de Bruijn Graph in Reference-Assisted Assembly

Ragout - это тул для улучшения сборки с помощью нескольких референсов. Проект предполагает разработку/улучшение алгоритмов, связанных с обработкой de Bruijn графа. Он скорее исследовательский, чем образовательный и предполагает большой объем самостоятельной работы со стороны студента.

VCF File Storage

Проект посвящен созданию программного интерфейса к базе данных HBase, позволяющего  сохранять несколько VCF-файлов, относящихся к общему референсу в 1 таблице, тем самым устраняя избыточность в хранимой информации и повышая скорость обработки данных за счет их представления в табличном, а не текстовом формате.

Также интерфейс предоставляет возможность восстановить исходный VCF-файл из табличного представления.

 

Misassemblies detection without reference

Проект посвящен оценке качества сборки генома. На сегодняшний день продукт QUAST может обнаружить ошибки в контигах (misassemblies) только при наличии референсной последовательности. Однако, такая последовательность доступна далеко не для всех организмов. Задачей проекта стало выявление ошибок сборки при отсутствии референса. В ходе работы была написана утилита, принимающая на вход сборку генома и набор парных ридов, и формирующая отчет о возможных ошибках в сборке.

Скаффолдинг контигов с использованием базы генов

Проект ставит своей целью проверить возможность использования базы генов организма (возможно, родственного) для улучшения качества сборки генома. Используется относительное положение экзонов одного гена в хромосоме и в случае достаточно хорошего в правильном порядке выравнивания всех экзонов гена можно сказать, что порядок последовательностей, на которые эти экзоны выровнялись, определён. Для более точного выявления правильных рёбер и исключения ложных соединений использовалась также фильтрация обнаруженных рёбер по некоторым эвристическим правилам.

Pages

Subscribe to RSS - AU project