BI project

RNA-Sequencing analysis

Проект посвящен анализу данных RNA-seq, полученных от людей с аутизмом и контрольной группы. Аутизм - расстройство, связанное с нарушением неврологического развития, диагностируемое у более чем 1% детей. Сначала данные были проанализированны с помощью программы Kallisto и пакета для R Sleuth. Выявлен 31 ген, показывающий значимо различающиеся уровни экспрессии в case и control группах, найдены соответсвующие белки. Результаты были верифицированы с помощью более традиционного пайплайна.

Machine learning in disease sub-network discovery

The genetic causes of most neuronal diseases are still unknown. With the huge WGS datasets (~ PetaB) from thousands of families, we now have a unique chance to decode them. Students will need to develop and apply clustering, graph theory & machine learning algorithms to explore this dataset.

Antibiotic Sequencing

"The goal of this project is to visualize the annotation of mass spectrum with respect to peptide for the Peptide Specctrum Matches (PSMs) brought by dereplicator. Antibiotic sequencing is one of the main six research areas at the NIH Center of Computational Mass Spectrometry: http://proteomics.ucsd.edu/research-areas/antibiotics-sequencing/.

Улучшение качества геномных сборок: поиск структурных ошибок и заполнение разрывов в скаффолдах

Проект посвящен задаче улучшения качества сборки геномов de novo и выполнен в рамках подготовки магистерской диссертации в СПбАУ РАН. Дата защиты: июнь 2015. 

BroadPeaks - ре-имплементация алгоритма SICER для определения пиков в соответствующих экспериментах ChIP-Seq.

При обработке данных экспериментов ChIP-Seq одной из чувствительных проблем является определение пиков (peak calling). 

Существует ряд алгоритмов и программ, которые можно условно разделить на две группы - определители для узких и широких пиков. 

Де-факто стандартной программой для узких пиков является MACS. 

Стандартных программ для широких пиков на данный момент не существует, однако одной из самый простых и эффективных является программа SICER. К сожалению, программа SICER обладает рядом существенных недостатков, и в данный момент практически не поддерживается. 

Поиск консервативных аминокислотных остатков для белка альфа-кристаллина позвоночных

Альфа-кристаллины - это АТФ-независимые молекулярные шапероны, они экспрессируются в высоких концентрациях в хрусталике глаза позвоночных, где играют основную роль в поддержании прозрачности хрусталика. Кроме того, было показано, что кристаллины способны связывать металлы, проявлять различные ферментативные активности и не редко являются ключевым звеном в развитии нейродегеративных заболеваний. Несмотря на биологическую важность данного белка, его полная структура остается загадкой.

Мультигенная филогения микроспоридий

Микроспоридии ― уникальная группа одноклеточных эукариот. Микроспоридии имеют большое теоретическое (как модель предельно допустимой для эукариот минимизации клетки и генома) и практическое значение (как возбудители заболеваний вредителей сельского и лесного хозяйства, промысловых и культивируемых видов животных, а также человека).

Разработка алгоритмов для анализа палео-геномов

Выравнивание ридов, полученных в результате секвенирования древних образцов ДНК, на референс современного организма представляет собой сложную задачу. Одна из основных проблем здесь - это ошибки в древней последовательности ДНК, которые могут быть ошибочно рассмотрены как SNP, и, следовательно, могут привести к искажению результатов. Для того, чтобы избежать такой ситуации, необходимо наличие инструмента, позволяющего оценить вероятность ошибки в древней ДНК.

Улучшение результатов работы MGRA2 и разработка алгоритма для решения проблемы медианы с событиями вставок и удалений

На данный момент из всего множества алгоритмов, которые реконструируют предковые геномы, существует два явных лидера GASTS и MGRA. Если первое программное средство пытается итеративно решать проблему медианы с помощью, так называемых адекватных подграфов, то второе программное средство пытается решить эту проблему используя максимум доступной информации с помощью модели T-консистентных цветов и множественного breakpoint графа. Удивительно то, что адекватные подграфы размера 1, это тоже самое, что хорошие циклы/пути в терминах MGRA.

Pages

Subscribe to RSS - BI project