Анализ поверхности взаимодействия белков и поиск наиболее значительных позиций методом in silico Ala-scan

Проект выполняется в рамках подготовки магистерской диссертации в СПбАУ РАН по направлению "Алгоритмическая биоинформатика". Дата защиты: июнь 2015 года.


In silico Ala-scan - теоретическая версия экспериментального комбинаторного метода, применяемого органическими химиками для решения простой задачи - понять, какая аминокислота оказывает существенный вклад в структуру белка. Идея метода состоит в замене одной аминокислотой в цепочке аланином и наблюдении, как это повлияло на свойства белка - и далее по всем позициям в белке. Если при замене аминокислоты в какой-либо позиции свойство улучшились, то для позиции, в которой это произошло, среди аминокислот и ищем ту, при подстановке которой улучшение экстремально.

У ala-scan есть один недостаток: при большой длине белка существенно увеличивается сложность метода, появляется необходимость фильтровать данные и проводить ala-scan не по всем позициям, а выборочно.

Поэтому задача решалась путем фильтрации входных данных перед применением теоретического ala-scan для улучшения структуры известного белка (а именно лучшей сцепленности между двумя парами цепочек). Была поставлена задача: для пары цепочек в протеине научиться  определять, какие пары аминокислот в цепочках сцеплены между собой хорошо или плохо.

Написан набор классов, решающих следующие задачи:

  1. Чтение цепочки аминокислот в формате Protein Data Bank.
  2. Построение трехмерной триангуляции Делоне (написана интерактивная версия алгоритма) для каждой из прочитанных цепочек.
  3. Для пары поверхностей, приближенных трехмерными триангуляциями и соответствующих паре цепочек, определение пар самых близких и самых удаленных пар точек (с использованием расстояния Хаусдорфа).

Были написаны тесты, подтверждающие корректность работы классов.

Студент:
   Татьяна Малыгина
Куратор:
   Павел Яковлев
Время выполнения проекта: Jul 2014 — Jun 2015
Файлы:
   malygina_thesis_slides.pdf