BI project

Сборка аминокислотных подпоследовательностей

Сборка аминокислотных подпоследовательностей из масс-спектров антител очень важна для изучения их свойств и антигенной специфичности. Основная идея алгоритма заключается в поиске тегов – небольших аминокислотных подпоследовательностей и их дальнейшее продление при помощи выравнивания спектров. Основным результатом является восстановления более 50% вариабельного региона на основе top-down данных. Также были получены небольшие аминокислотные подпоследовательности при использовании bottom-up данных.

Изучение структурных вариаций в геноме Mycobacterium tuberculosis

Целью проекта является поиск структурных вариаций генома различных штаммов Mycobacterium tuberculosis (обычно изучаются лишь однонуклеотидные полиморфизмы). Для этого необходимо провести сборку геномов M. tuberculosis до контигов, их сравнение с референсными геномами (прежде всего, H37Rv) с использованием биоинформатических подходов, определить вероятные области геномных перестроек и методом ПЦР проверить наличие указанных перестроек в образцах ДНК отобранных изолятов. Это исследование позволит лучше изучить структуру генома M.

К-меры в геноме одного вида, секвенирванного разными платформами (мышь/дрожжи)

В последовательности нуклеотидов k-меры - подпоследовательности длины k. Подсчёт вхождений таких подпоследовательностей является главным этапом в некоторых алгоритмах геномной сборки и нуклеотидного выравнивания. Цель нашей работы - сравнение состава k-меров в геномах, просеквенированных разными платформами. На примере двух модельных организмов - дрожжей и мыши - проанализирован спектр к-меров, их состав и уникальность. Сравнение Roche 454 и Illumina платформ позволило оценить количество ошибок, вносимых разными технологиями секвенирования.

Dragonfly genome project

Задачей проекта являлось изучение генома стрекозы. Были пойманы и определены стрекозы, выделена и подготовлена к отправке ДНК, оценено ее качество, определен размер генома методом реалтайм ПЦР, изучены типы повторов на основе кривой реассоциации. Рассмотрена филогения стрекоз. Были изучены консервативные гены развития на основе сопоставления их с генами дрозофилы, детально рассмотрен оказавшийся высоковариабельным Met ген, первоначально не найденный в сборке Ladona Fulva инструментом MegaBLAST.

Multiple Global Alignment in C-Sibelia

C-Sibelia представляет собой инструмент для полногеномного выравнивания. На вход он принимает два генома, которые разбиваются на гомологичные блоки, и затем происходит глобальное выравнивание полученных блоков друг на друга. Было принято решение адаптировать существующий алгоритм для выравнивания множества последовательностей.

Практические занятия по пробоподготовке, секвенированию и первичному анализу данных NGS с последующим анализом рисков при их использовании в клинической генодиагностике

Проект был в большей степени  учебным и в фокусе находилсь практические аспекты полупроводникового секвенирования - от выделения ДНК до SNP call. NGS методы часто рассматриваются исследователем как материал для статистического анализа, что в случае клинического применения невозможно. По этой причине необходимо производить оценку рисков на всех стадиях анализа. Попытка выявить и оценить подобные риски входила в задачи проекта.

Создание курса по NGS на платформе Stepic

Проект посвящен разработке курса ”Next Generation Sequencing” для сайта stepic.org на базе соответствующей вики-книжки. Необходимо было адаптировать информацию с этого ресурса для определенного формата сайта. Информация разбивалась на короткие блоки, для лучшего усвоения материала. Кроме теории по данным вопросам, внедрен workflow, позволяющий попробовать самому сделать небольшую работу по этой теме. Проект, как и планировалось, доделан до раздела ”alignment”.

Aurelia aurita: поиск новых генов

Aurelia aurita – модель ддя изучения молекулярной регуляции сложного жизненного цикла. Этот вид также стал объектом геномного исследования благодаря взаимному интересу Лаборатории им. Добржанского и Кафедры зоологии беспозвоночных (СПбГУ). Летом 2013 года были получены первые результаты секвенирования на Illuimna MiSeq. Исходно задачей осенней работы был поиск новых генов в этом геноме. Однако, основное внимание в итоге было уделено поиску оптимального способа сборки генома.

Rosalind Quest

Проект ставил своей целью положить начало новому классу проблем на всем известной биоинформатической платформе rosalind.info. Эта задача была спроектирована для программистов, которые хотели бы лучше узнать про особенности метода ПЦР, который всё ещё очень широко применяется в современной биологии. ПЦР используют не только для научных целей, но и для клинических. ПЦР даёт великолепные возможности для быстрой и точной диагностики инфекционных и генетических заболеваний.

Complete assembly of repetitive HSV genomes from short reads

Были даны парные риды ДНК одного из штаммов простого герпеса. Риды содержали контаминации, которые нужно было убрать. Для этого использовалось несколько разных методов: выравнивание по вирусному референсу, выравнивание по референсу человека и анализ покрытия. Контаминации отсеивались, после чего риды несколькими способами собирались в контиги. Используя информацию о парности ридов, были собраны скаффолды. Собрать и аннотировать геном целиком не удалось, возможно, из-за ошибки на каком-то из этапов.

Pages

Subscribe to RSS - BI project