AU project

Finding structural motifs in Natural Products

Natural Products (NPs) have an unparalleled track record in pharmacology: most anticancer and antimicrobial agents are natural products or their derivatives. NPs are usually categorized into multiple classes based on their biosynthetic origin (Peptidic NP ­­ PNP, Polyketides, Alkaloids, etc). The amide bond is a well­known structural motif for PNPs. In order to better understand different classes of NPs, motifs in these classes should be found as well.

Разработка алгоритма предсказания локального происхождения

Существуют наследственные заболевания, присущие определённым человеческим популяциям (народностям, племенам). При этом в процессе географического распространения человека и слияния популяций возникают индивиды, имеющие смешанное происхождение. Из­за множественных рекомбинаций их геномы представляют собой мозаику из оригинального генофонда их предков.

A comprehensive comparison of tools for differential ChIP-seq analysis

ChIP-seq has become a widely adopted genomic assay in recent years to determine binding sites for transcription factors or enrichments for specific histone modifications. Beside detection of enriched or bound regions, an important question is to determine differences between conditions. While this is a common analysis for gene expression, for which a large number of computational approaches have been validated, the same question for ChIP-seq is particularly challenging owing to the complexity of ChIP-seq data in terms of noisiness and variability.

Сегментация результатов MALDI-спектрометрии

Результатом работы метода MALDI, относящегося к группе методов масс-спектрометрического изображения, является набор спектров для каждой точки поверхности исследуемого образца ткани. В таком виде данные неприменимы для непосредственного анализа. В общем случае задача заключается в нахождении химического состава каждого участка образца.

Анализ ошибок амплификации в данных иммуносеквенирования

Амплификация генетического материала применяется в экспериментах для искусственного увеличения его количества (пример, при секвенировании РНК или одноклеточном секвенировании). Процесс амплификации не является точным и вносит случайные ошибки (замены, короткие вставки и удаления). Многократное копирование генетической последовательности, ставшей ошибочной на раннем этапе, делает такие ошибки практически неотличимыми от естественных вариаций.

Улучшение бининга контигов в метагеномных сборках с использованием графа сборки

Цель проекта - разработка и реализация стратегии улучшения бининга контигов в метагеномных сборках с использованием графа сборки.

В ходе проекта был реализован пайплайн для обработки контигов, использующий сборщик SPAdes и существующий алгоритм кластеризации контигов. На основе предварительной кластеризации выполняется дополнение бинов путём обхода графа сборки, полученного с помощью SPAdes.

De Bruijn graph simplification based on perfect hashing

Задача проекта состояла в том чтобы расширить пайпалайн сборки в SPAdes, а именно добавить функциональность позволяющую упростить граф Де Брёйна до того как начнется его сжатие.

В результате, на основе структур данных, уже реализованных в SPAdes, был разработан Erroneous Connection Remover, удаляющий большое количество коротких, плохо покрытых путей в несжатом графе Де Брёйна, что позволило освободить значительное количество ресурсов и ускорить общее время сборки генома.

100 геномов Бронзового века

Сравнить геномы человека Бронзового века с геномами современных людей.

Задача: прогнать эти данные на наследственные заболевания, посмотреть, чем болели, чем не болели. Посмотреть, как они проецируются на современного человека. На кого он больше похож? На древнего кельта? Использовать данные чипов для кроссвалидации.

Данные открыты: http://www.nature.com/nature/journal/v522/n7555/full/nature14507.html

 

Локальное выравнивание последовательностей с использованием внутрипроцессорного параллелизма

Целью проекта является изучение потенциала алгоритма полулокального выравнивания seaweed, а именно решения задачи поиска выравниваний, на которых достигаются оптимальные значения задачи наибольшей общей подпоследовательности для двух подстрок входных данных.

RNA-Sequencing analysis

Проект посвящен анализу данных RNA-seq, полученных от людей с аутизмом и контрольной группы. Аутизм - расстройство, связанное с нарушением неврологического развития, диагностируемое у более чем 1% детей. Сначала данные были проанализированны с помощью программы Kallisto и пакета для R Sleuth. Выявлен 31 ген, показывающий значимо различающиеся уровни экспрессии в case и control группах, найдены соответсвующие белки. Результаты были верифицированы с помощью более традиционного пайплайна.

Pages

Subscribe to RSS - AU project