Научные проекты

На летней школе была организована работа над небольшими научными задачами в командах из разных потоков (биологи и информатики). 

27 июля состоялись презентации проектов научными руководителями и распределение участников, изъявивших желание поработать над научными задачами в дополнение к основной программе школы. Несмотря на то, что одним из требований к участию в проектах было наличие начальных знаний и опыта в биоинформатике, к ним смогли присоединиться и несколько мотивированных новичков.

За пять дней студентам требовалось ознакомиться со статьями по теме проекта, освоить использование необходимых инструментов и выполнить поставленные руководителем задачи. Формат предполагал активное использование системы контроля версий git для отслеживания ежедневного прогресса и публикации полученных результатов. Завершилась работа в последний день школы презентацией результатов перед всеми участниками школы и жюри.  

Об организации работы над научными проектами "изнутри" можно также прочитать на "Мегамозге".

Описания проектов

1. Аннотация ядерной митохондриальной ДНК (numt) в геномах позвоночных

Появление ядерной митохондриальной ДНК связано с частичным переносом генетического материала митохондрии в ядерную геномную последовательность. Аннотация данных элементов генома очень интересна с точки зрения эволюции организма и функционирования генома. Для выполнения проекта потребуется работа как с уже хорошо известными программами для локального выравнивания (например, BLAST), так и написание своих скриптов для обработки данных. Статья: Lopez, J.V., Yuhki, N., Modi, W., Masuda, R., O'Brien, S.J. (1994). "Numt, a recent transfer and tandem amplification of mitochondrial DNA in the nuclear genome of the domestic cat". Journal of Molecular Evolution 39 (2): 171–190. PMID 7932781 (полный текст можно запросить у руководителя проекта).

Руководитель: Павел Добрынин (Центр геномной биоинформатики СПбГУ).

Состав команды: Вахрушева Анна, Егорова Анна, Игнатьев Владимир, Керманов Антон, Ковач Евдоким, Пшеничный Евгений, Сагарадзе Георгий, Черепкова Мария.

Презентация | Репозиторий

2. Поиск эндогенных ретровирусов (ERV) в геномах эукариот

Изучение эндогенных ретровирусов интересно с точки зрения эволюции вида. ERV являются геномными реликтами из прошлого, появившимися в результате встречи организма с ретровирусной инфекцией. Иногда они даже выполняют некоторые функции в геноме, например, участвуют в формировании плаценты. Задача данного проекта состоит в том, чтобы найти и описать ERV в геноме. Для решения этой задачи на начальном этапе будет необходимо провести поиск уже известных ERV и их фрагментов по различным базам данных, а потом попытаться найти их в исследуемом геноме. Использование BLAST, методов поиска ERV de novo и работа с филогенетическими программами позволят успешно завершить проект. Полезная информация.

Руководитель: Павел Добрынин (Центр геномной биоинформатики СПбГУ).

Состав команды: Беднягин Лев, Бойко Алексей, Бушманова Вера, Егорова Елена, Жернакова Дарья, Липницкая Софья, Свеколкин Виктор, Хомяков Иван, Чернышёва Анна, Шапиро Михаил.

Презентация | Репозиторий

3. Оценка разнообразия и степени дивергенции повторов в различных эукариотических геномах

Аннотация повторов один из первых шагов после сборки генома в любом геномном проекте. Несмотря на кажущуюся рутинность процедуры, зачастую возникает множество трудностей. В рамках данного задания нужно будет работать с такими программами как Repeat Masker и TRF, а так же писать простые скрипты. Будет необходимо проаннотировать тандемные и диспергированные повторы, отдельно сделать track с микросателлитами и дополнительно оценить степень дивергенции различных групп повторов в исследуемом геноме по сравнению с базой данных RepBase. Полезная информация.

Руководитель: Павел Добрынин (Центр геномной биоинформатики СПбГУ).

Состав команды: Карташов Никита, Клюева Мария, Конова Варвара, Маяковская Алёна, Потапова Надежда.

Презентация | Репозиторий

4. Подготовка данных ChIP-seq эксперимента для биологов (платформа Illumina)

С помощью экспериментов ChIP-seq биологи могут узнать, где и как белки взаимодействуют с ДНК. В частности, можно увидеть, происходит ли связывание того или иного транскрипционного фактора с ДНК при определенных условиях. Обычно, в ChIP-seq экспериментах, биологи определяют, как связывается с ДНК только один белок (target protein). Для этого используются антитела, которые присоединяются к ДНК-белковым комплексам. Затем, из полученных комплексов выделяют ДНК, которая секвенируется методом NGS. Сырые данные, полученные сразу после секвенирования, непригодны для анализа биологом, поэтому задача биоинформатика – подготовить их. Для ChIP-seq эксперимента в подготовку входят шаги фильтрации, выравнивания и поиска пиков.

Руководители: Юрий Васькин (UNIPRO); Олег Яснев (СПбАУ РАН).

Состав команды: Девятияров Руслан, Карякин Денис, Кипень Вячеслав, Киргизова Виталина, Кирсанова Оксана, Коростелева Анастасия, Макаренко Ростислав, Матвеева Мария, Прокопьев Алексей, Сергушичев Алексей, Смирнов Дмитрий, Стрелкова Татьяна, Тадевосян Карине, Шувалова Екатерина.

Презентация | Репозитории: 1, 2, 3, 4 

5. Изучение демографической истории не-модельных организмов при помощи данных о частотах SNP

Демографическая история различных видов отражена в генетических вариантах внутри популяций и между популяциями. Мы воспользуемся различными методами для вычисления ожидаемого распределения генетических вариантов для не-модельного организма (скорее всего, полярного медведя) используя математическую модель, включающую в себя изменения в размерах популяций, разделения и слияния популяций, миграции. Полярные медведи живут в экстремальных условиях, поэтому особенно интересно посмотреть на их историю и на влияние различных видов отбора. Также в нашем распоряжении есть геномы бурых медведей, что позволит исследовать варианты между популяциями. Статья.

Руководитель: Герман Демидов (СПбАУ РАН).

Состав команды: Алехин Алексей, Гладышев Сергей, Дубинкина Вероника, Кружилин Василий, Кузьмич Софья, Ларионов Константин, Медведев Александр, Ракитько Александр, Тарасова Илария.

Презентация | Репозиторий

6. Поиск участков патогенности в геномах E.coli

Некоторые штаммы кишечной палочки Escherichia coli являются патогенными. Один из таких штаммов, E.coli O104:H4, был причиной вспышки пищевых отравлений в Европе в 2011м году. Для определения причины патогенности предлагается провести геномный анализ данного штамма, сравнить его с непатогенными и провести анализ найденных различий. В рамках задания потребуется собрать бактериальный геном патогенного штамма из исходных данных с помощью SPAdes, проаннотировать его с помощью базы RAST, сравнить несколько штаммов (программы MAUVE, BRIG и т.п.) и охарактеризовать патогенные участки, используя BLAST. Статья.

Руководитель: Михаил Райко (Центр геномной биоинформатики СПбГУ).

Состав команды: Бутенко Николай, Голокоз Александр, Гусак Юлия, Доменикан Александр, Зайнагтдинова Галия, Иванов Кирилл, Котенко Анастасия, Малиновский Илья, Митрофанова Ольга, Ненарокова Анна, Орлова Марина, Фурменков Александр, Шишкина Элина.

Презентация | Репозитории: 1, 2, 3 

Итоги

Презентации участников оценивало жюри, в состав которого вошли спикеры и организаторы школы. Подводя итоги, жюри отметило, что все команды справились с работой над проектами и показали хорошие результаты. Победителем признали команду, работавшую над проектом “Изучение демографической истории не-модельных организмов при помощи данных о частотах SNP” (проект №5).

Мы поздравляем участников и победителей и желаем им дальнейших успехов в научной карьере!