BI project

Оценка рецептивности эндометрия по изменению транскрипционного профиля

Цели проекта:

  1. Разработка алгоритма анализа данных геномного и экзомного секвенирования для диагностики наследственных эндокринологических заболеваний.
  2. Анализ распространенности различных известных мутаций, связанных с наследственными эндокринологическими заболеваниями, поиск новых мутаций.

Задачи:

Изучение распределения ДНК древних людей в современных геномах

Для изучения распределения ДНК древних людей в современных геномах были поставлены и выполнены следующие задачи:

Определение родственных связей по данным генотипирования

Аппарат обнаружения близкородственных связей достаточно хорошо развит, чего нельзя сказать о поиске родственников 3-10 поколений. Компания 23&me предложила алгоритм, определяющий степень родства двух индивидов по количеству и суммарной длине IBDhalf сегментов, то есть определенных участков хромосом, которые предположительно "пришли" от общего предка. Однако данный метод является не очень точным.

Оценка «скрытого разнообразия» высших грибов и миксомицетов в почвах уязвимых природных экосистем

Цель даного проекта -- на примере Нижне-Свирского заповедника методами NGS выявить скрытое разнообразие высших грибов и некоторых "грибоподобных протистов" (миксомицетов) в почве, а также оценить долговременное влияние лесных пожаров на сообщества этих организмов.

Поиск генов относящихся к MHC региону

Целью нашей работы была аннотация региона MHC у трёх позвоночных животных (Tursiops truncatus, Ailuropoda melanoleuca и Vicugna pacos). В работе использовались уже имеющиеся данные о структуре MHC у позвоночных (на примере человека). В соответствии с поставленной целью, были сформулированы следующие задачи:

Скаффолдинг на основе генов/экзонов

Проект посвящён задаче скаффолдинга при сборки геномов de novo. Для разрешения повторов, циклов, неотсеквенированных участков ДНК применяется метод парных прочтений или метод mate pair. В этом случае требуется проведение дополнительных экспериментов. Это создаёт дополнительные трудности и возможности проведения эксперимента может не быть. Было выдвинуто предположение, что в качестве парных прочтений можно использовать известные экзонные последовательности родственных организмов. 

Улучшение бининга контигов в метагеномных сборках с использованием графа сборки

Цель проекта - разработка и реализация стратегии улучшения бининга контигов в метагеномных сборках с использованием графа сборки.

В ходе проекта был реализован пайплайн для обработки контигов, использующий сборщик SPAdes и существующий алгоритм кластеризации контигов. На основе предварительной кластеризации выполняется дополнение бинов путём обхода графа сборки, полученного с помощью SPAdes.

Изучение изменения экспрессии генов при дифференцировке нейронов

Целью работы является определение типичных профилей экспрессии генов эпигенетических регуляторов при клеточной дифференцировке и выявление различия в паттернах экспрессии генов в нормальных клетках и клетках с дополнительной копией плеча 21 хромосомы.

В рамках этого проекта решалась следующая задача:  изучение систем метилирования и деметилирования ДНК в норме и патологии, с применением пакета Time course gene set analysis (TcGSA) для R.

Эпигенетические регуляторы при дифференцировке нейронов

Цель: определение паттернов экспрессии эпигенетических регуляторов при дифференцировке iPS в нейроны в клетках дикого типа и в клетких с синдромом Дауна.

Задачи:

  1. выявить систему\ы эпигенетических регуляторов наболее существенно меняющую активность в процессе дифференцировки,
  2. определить различия в эпигенетической регуляции между клетками дикого типа и клетками с синдромом Дауна (которые в частности, имеют дополнительную копию гена DNMT3L).

     

Предсказание вторичной структуры белка методами Deep Learning

Главная цель проекта - получение из первичной структуры белка вторичную с использованием нейронных сетей. А именно используются алгоритмы глубокого обучения.

В результате данной работы была построена модель сети, подготовлена выборка из 70 тысяч белков. Написана сеть на языке python с использованием пакета theano. К сожалению, сеть работает корректно только для белков с 1 одной цепью. Целью дальнейшего исследования является построение адекватного алгоритма для предсказания белков с несколькими цепями.

Pages

Subscribe to RSS - BI project