BI project

Immunoglobulin folding

Проект направлен на изучение построения трехмерной модели имуноглобулинов. На основе существующего протокола Rosetta Antibody необходимо было сделать скрипт, выполняющий построение модели антител камелидов, то есть антител, обладающих только тяжелой цепью.

Естественный отбор и нейтральная эволюция в митохондриальной ДНК различных групп животных

Митохондриальная ДНК - крайне важный компонент клетки, участвующий в ключевых энергетических процессах. В последние два десятилетия, отдельные фрагменты митохондриальной ДНК интенсивно используются для филогенетических и филогеографических исследований различных видов. В то же время, не прекращаются горячие дебаты на тему подверженности митохондриального генома отбору - как положительному, так и отрицательному, что ставит вопросы, об его использовании, как филогеографического маркера.

Deep Learning Approach in Genomics

Проект посвящен анализу данных single-cell РНК-секвенирования здоровых людей и пациентов с онкологическими заболеваниями, включая образцы от пациентов, подвергавшихся лечению. В задачи проекта входила предварительная обработка данных РНК-секвенирования с последующим анализом отличий между образцами здоровых людей а также образцами пациентов до и после терапии.

Repeat classification in mammalian genomes

Целью проекта было ввести студентов в область изучения природы повторов в человеческом геноме. В качестве введения была предложена задача о поисках target site duplications (TSD), по итогам которой был разработан алгоритм поиска TSD в человеческом геноме и собрано множество статистик. Способность определять TSD может послужить ключом к решению более сложных задач. После этого было предложено еще несколько крупных задач, имеющих практическую ценность и не имеющих общепризнанного подхода к решению.

Скаффолдинг бактериальных контигов с использованием нескольких референсов и дерева на примере геномов Gluconacetobacter

Бактерии Gluconacetobacter sp. широко распространены в природе и активно используются в промышленности. Они применяются при производстве уксуса, пива, некоторых национальных десертов, а также являются важной составляющей чайного гриба. Одна из интересных особенностей этих бактерий — умение вырабатывать микробиологическую целлюлозу, волокна которой более прочные и длинные по сравнению с растениями. При сотрудничестве кафедры микробиологии СпбГУ и центра геномной биоинформатики им. Ф.Г.

Оценка качества транскриптомных сборок

В ходе проекта были рассмотрены статьи об уже существующих транскриптомных сборщиках. На основе предложенных авторами статей метрик, для оценки качества транскриптомной сборки была разработана утилита Trans-QUAST, получающая статистики покрытия аннотированных генов и экзонов.

Trans-QUAST работает в четырех режимах в зависимости от начальных данных:

Assembly Scaling Bottlenecks

Currently SPAdes assembler is among the top choices for processing bacterial datasets. Now we would like to move to much larger genomes. Project’s goal is the analysis of bottlenecks and development of non-trivial data structures and parallelization tricks to scale by three orders of magnitude.

Hmmer on GPU

В проекте планировалось разработать новую open source версию Hmmer, которая будет работать на GPU. В задачи проекта входили: изучение предметной области, разбор алгоритмов, используемых в Hmmer, адаптация алгоритмов к работе на GPU, реализация работы алгоритмов на GPU. При работе с GPU следует учитывать специфичность работы ядер этого устройства, а так же маленький размер памяти. Программный пакет Hmmer состоит из нескольких модулей, которые могут работать независимо друг от друга.

Молекулярные аспекты создания лекарственных препаратов

При разработке лекарственных препаратов большую популярность приобретают методы компьютерного моделирования. Они позволяют предсказывать возможные биологические свойства молекул на основе их трехмерной структуры.

Pages

Subscribe to RSS - BI project