На данном сайты содержится только архивная информация о проектах Института биоинформатики до 2016 года.
Вся новая информация располагается на новом сайте: https://bioinf.me.

Check out the new website of the Bioinformatics Institute: https://bioinf.me.

AU project

Finding structural motifs in Natural Products

Natural Products (NPs) have an unparalleled track record in pharmacology: most anticancer and antimicrobial agents are natural products or their derivatives. NPs are usually categorized into multiple classes based on their biosynthetic origin (Peptidic NP PNP, Polyketides, Alkaloids, etc). The amide bond is a wellknown structural motif for PNPs. In order to better understand different classes of NPs, motifs in these classes should be found as well.

Read more about Finding structural motifs in Natural Products

Разработка алгоритма предсказания локального происхождения

Существуют наследственные заболевания, присущие определённым человеческим популяциям (народностям, племенам). При этом в процессе географического распространения человека и слияния популяций возникают индивиды, имеющие смешанное происхождение. Изза множественных рекомбинаций их геномы представляют собой мозаику из оригинального генофонда их предков.

Read more about Разработка алгоритма предсказания локального происхождения

A comprehensive comparison of tools for differential ChIP-seq analysis

ChIP-seq has become a widely adopted genomic assay in recent years to determine binding sites for transcription factors or enrichments for specific histone modifications. Beside detection of enriched or bound regions, an important question is to determine differences between conditions. While this is a common analysis for gene expression, for which a large number of computational approaches have been validated, the same question for ChIP-seq is particularly challenging owing to the complexity of ChIP-seq data in terms of noisiness and variability.

Read more about A comprehensive comparison of tools for differential ChIP-seq analysis

Сегментация результатов MALDI-спектрометрии

Результатом работы метода MALDI, относящегося к группе методов масс-спектрометрического изображения, является набор спектров для каждой точки поверхности исследуемого образца ткани. В таком виде данные неприменимы для непосредственного анализа. В общем случае задача заключается в нахождении химического состава каждого участка образца.

Read more about Сегментация результатов MALDI-спектрометрии

Анализ ошибок амплификации в данных иммуносеквенирования

Амплификация генетического материала применяется в экспериментах для искусственного увеличения его количества (пример, при секвенировании РНК или одноклеточном секвенировании). Процесс амплификации не является точным и вносит случайные ошибки (замены, короткие вставки и удаления). Многократное копирование генетической последовательности, ставшей ошибочной на раннем этапе, делает такие ошибки практически неотличимыми от естественных вариаций.

Read more about Анализ ошибок амплификации в данных иммуносеквенирования

Улучшение бининга контигов в метагеномных сборках с использованием графа сборки

Цель проекта - разработка и реализация стратегии улучшения бининга контигов в метагеномных сборках с использованием графа сборки.

В ходе проекта был реализован пайплайн для обработки контигов, использующий сборщик SPAdes и существующий алгоритм кластеризации контигов. На основе предварительной кластеризации выполняется дополнение бинов путём обхода графа сборки, полученного с помощью SPAdes.

Read more about Улучшение бининга контигов в метагеномных сборках с использованием графа сборки

De Bruijn graph simplification based on perfect hashing

Задача проекта состояла в том чтобы расширить пайпалайн сборки в SPAdes, а именно добавить функциональность позволяющую упростить граф Де Брёйна до того как начнется его сжатие.

В результате, на основе структур данных, уже реализованных в SPAdes, был разработан Erroneous Connection Remover, удаляющий большое количество коротких, плохо покрытых путей в несжатом графе Де Брёйна, что позволило освободить значительное количество ресурсов и ускорить общее время сборки генома.

Read more about De Bruijn graph simplification based on perfect hashing

100 геномов Бронзового века

Сравнить геномы человека Бронзового века с геномами современных людей.

Задача: прогнать эти данные на наследственные заболевания, посмотреть, чем болели, чем не болели. Посмотреть, как они проецируются на современного человека. На кого он больше похож? На древнего кельта? Использовать данные чипов для кроссвалидации.

Данные открыты: http://www.nature.com/nature/journal/v522/n7555/full/nature14507.html

Read more about 100 геномов Бронзового века

Локальное выравнивание последовательностей с использованием внутрипроцессорного параллелизма

Целью проекта является изучение потенциала алгоритма полулокального выравнивания seaweed, а именно решения задачи поиска выравниваний, на которых достигаются оптимальные значения задачи наибольшей общей подпоследовательности для двух подстрок входных данных.

Read more about Локальное выравнивание последовательностей с использованием внутрипроцессорного параллелизма

RNA-Sequencing analysis

Проект посвящен анализу данных RNA-seq, полученных от людей с аутизмом и контрольной группы. Аутизм - расстройство, связанное с нарушением неврологического развития, диагностируемое у более чем 1% детей. Сначала данные были проанализированны с помощью программы Kallisto и пакета для R Sleuth. Выявлен 31 ген, показывающий значимо различающиеся уровни экспрессии в case и control группах, найдены соответсвующие белки. Результаты были верифицированы с помощью более традиционного пайплайна.

Read more about RNA-Sequencing analysis

You are here