BI project

Поиск однонуклеотидных полиморфизмов штаммов Mycobacterium tuberculosis, распространенных в различных регионах мира

Первый геном Mycobaterium tuberculosis был секвенрован в 1998 году. По результатам многочисленных последующих геномных исследований (а к настоящему моменту секвенировано уже несколько тысяч геномов M. tuberculosis) обнаружили 7 основных географических линий возбудителя туберкулёза. Поиск SNP --  одна из основных задач любой работы по секвенированию M. tuberculosis сегодня.

Сравнительный анализ данных по РНК-секвенированию раковых клеток с использованием платформы Trinity

Проект посвящён одной из основных проблем современной онкологии - метастазированию. Целью проекта является широкомасштабная оценка транскриптома метастатических клеток рака прямой кишки методом РНК-секвенирования. В рамках проекта был проведён анализ данных РНК секвенирования с помощью сборки транскриптома de novo, без использования референса. В результате анализа были получены профили дифференциальной экспрессии для четырёх клеточных линий, отличающихся уровнями экспрессии онкомаркеров.

Haplotype Assembly in dipSPAdes

dipSPAdes является новым приложением, разработанным в лаборатории алгоритмической биологии СПбАУ и предназначенным для сборки высоко полиморфных диплоидных геномов. Целью настоящего проекта является разработка и интеграция в dipSPAdes алгоритма, позволяющего de novo собирать гапломы диплоидных геномов (haplotype assembly) на основе подхода, уже реализованного в dipSPAdes. Для достижения поставленной цели была адаптирована концепция двудольного взвешенного конфликт-графа, а также разработан алгоритм его построения.

Polymorphism Analysis in Diploid Genomes

Сборка диплоидных геномов - это сложная и на данный момент не до конца решенная задача из-за наличия различий между гапломами. DipSPAdes - приложение, предназначенное для сборки диплоидных геномов, использующее графы де Брюина. Целью данного проекта являлся анализ работы dipSPAdes на различных данных, поиск сложных полиморфизмов и модификация существующего алгоритма построения консенсусных контигов для корректной работы с такими полиморфизмами.

Development of Algorithms for Extension Index Data Structure

Целью проекта была реализация алгоритмов для упрощения несжатого графа де Брюина в spades. Упрощение несжатого графа позволяет сократить использование памяти для хранения сжатого. Как результат проекта было реализовано удаление пузырей (bulges) и ошибочных соединений (erroneous connections).

Связь последовательностей с отклонениями в частотах аминокислот с белок-белковыми взаимодействиями

Известно большое количество белков, имеющих участки, обогащенные определенными аминокислотами и взаимодействующие друг с другом. Данная работа посвящена исследованию роли обогащенных определенными аминокислотами участков в белок-белковых взаимодействиях и того, для каких белков характерен такой механизм взаимодействия. Целью проекта являлось изучение зависимости количества взаимодействий у белка с другими белками и наличия у обоих участников взаимодействия подпоследовательностей с измененной частотой одинаковых аминокислот в протеомах ряда эукариот.

Rearrangement-based fragment assembly

MGRA широко используется биологами для восстановления филогенетических деревьев и реконструкции общего предка. Данный алгоритм работает с полностью собранными геномами, но зачастую, мы располагаем только частичными сборками. В частности, нам требовалось обработать крайне фрагментированные данные москитов Южной Америки. В связи с этим возник проект, поставившей своей целью расширить возможности MGRA сборкой фрагментированных геномов на основе геномных перестроек.

Working with synteny blocks of di erent resolution

MGRA has troubles in genomic regions of high breakpoint reuse; we plan to eliminate these troubles by locally increasing resolution in such regions. Our goal is to increase the accuracy of MGRA tool. Synteny blocks of low resolution tend to be more reliable then high resolution blocks, but we may miss multiple evolutionary event while working with low resolution blocks only.

Нахождение регионов в вариабельных доменах иммуноглобулинов

Проект посвящен разработке ПО для поиска генов и поиска регионов в вариабельных доменах иммуноглобулинов, и является логическим продолжением проекта летней практики. Был разработан масштабируемый сервер, объединяющий в себе несколько способов поиска регионов и генов, включая способы, основанные на машинном обучении, и способы, основанные на аппаратном ускорении алгоритма локального выравнивания (на CPU и GPU).

Pages

Subscribe to RSS - BI project