BI project

Семейство генов nxf: тканеспецифичная экспрессия изоформ и идетнификация генов в новых геномах

Гены семейства nxf являются эволюционно консервативными и обнаружены у различных групп организмов, включая грибы и животных. Известно, что nxf1 участвует в экспорте мРНК из ядра в цитоплазму клетки. Его отличительной чертой является наличие альтернативных изоформ с неудаленным интроном, функциональное значение которых остается дискуссионным. Назначение nxf2 также является не выясненным.

Поиск адаптеров в собранных геномах

При создании библиотек ДНК для секвенирования к фрагментам ДНК пришивают адаптеры – полинуклеотидные фрагменты, облегчающие амплификацию и стыковку ридов. В результате при секвенировании прочитывается не только исследуемый фрагмент, но и адаптер. Поскольку последовательности нуклеотидов адаптеров известны, они обычно удаляются при обработке ридов.
Целью данного проекта являлось проверить наличие адаптеров компании Illumina в собранных геномах.

Результаты:

Поиск иммуногенных фрагментов на белковых последовательностях

Иммуногенность -- свойство антигена вызывать иммунный ответ за счет негативного распознавания рецепторами (IG, TCR, MHC). Известно, что иммунный ответ на различные белки связан со свойствами их конформаций: жесткостью структуры, паттернами вторичной структуры и т.д. Распространенным методом предсказания иммуногенности белка является нарезание этого белка на k-меры и определение гомологичности с известными фрагментами, вызывающими иммунных ответ.

Оценка геномного ассемблера Platanus

Новый геномный ассемблер Platanus разработан для сборки гетерозиготных геномов.
Цель проекта -- собрать небольшой известный геном, проверить количество мисассемблов и сравнить с результатами работы другого ассемблера. Для этой задачи был выбран геном нематоды Caenorhabditis elegans, альтернативным ассемблером стал SPades 3.0. 

De novo сборка бактериального генома и оценка скаффолдеров

Объектом исследования являются бактерии рода Gluconacetobacter. Данный род относится к так называемым уксуснокислым бактериям и известен тем, что он входит в такую симбиотическую ассоциацию, как чайный гриб.
Одной из интересных особенностей данных бактерий является способность производить целлюлозу, аналогичную растительной.

RepeatScout

RepeatScout -- инструмент для de novo поиска повторов, разработанный в лаборатории Павла Певзнера в 2005 году. До сих пор лучших альтернатив придумано не было.
Однако RepeatScout не работает для больших геномов из-за переполнения типа int. В популярном инструменте RepeatModeler это обходят, беря несколько раз небольшой фрагмент генома и обрабатывая его в RepeatScout, но при таком подходе часть повторов теряется.

Свой RepeatMasker

В рамках проекта разрабатывался подход к изучению филогении повторов в пределах одного генома, что может облегчить анализ эволюции структур геномов и понимание эволюции самих семейств повторов.

Networks Integration

Данный проект является прямым следствием применения алгоритмического подхода, позволяющего одновременно определять гены и некорректно функционирующие пути в молекулярной сети взаимодействий относительно изучаемого заболевания. Для этого используются профили экспрессии генов, локусы, которые имеют значительные изменения в CNV, и сети разных по типу молекулярных взаимодействий.
Изначальная цель проекта — интеграция различных геномных данных в результат работы этого алгоритма.
К задачам проекта можно отнести следующие:

Local Sequence Alignment by Using Onchip Parallelism

Большинство алгоритмов, используемых в биоинформатике, по определению предназначены для работы с данными большого размера. Поэтому их эффективность является ключевым фактором.
Один из возможных вариантов ее увеличения -- это использование дополнительных возможностей процессора, позволяющих ускорять некоторые элементарные операции за счет использования внутрирегистровой векторизации вычислений.

Оценка качества работы программы "Ragout"

Ragout -- программа для упорядочивания контигов с использованием нескольких референсных геномов и филогенетического дерево.
В данном проекте изучался вопрос, насколько хорошо это упорядочивание соответствует истине.
Есть несколько крупных проектов по сборке геномов конкретных видов, такие, как "Mouse genome project", которые в рамках данной работы можно считать за "верный результат". На примере Drosophila sp. исследовалось качество работы Ragout при разном количестве референсных геномов.

Pages

Subscribe to RSS - BI project