Анализ поверхности взаимодействия белков и поиск наиболее значительных позиций методом in silico Ala-scan
Проект выполняется в рамках подготовки магистерской диссертации в СПбАУ РАН по направлению "Алгоритмическая биоинформатика". Дата защиты: июнь 2015 года.
In silico Ala-scan - теоретическая версия экспериментального комбинаторного метода, применяемого органическими химиками для решения простой задачи - понять, какая аминокислота оказывает существенный вклад в структуру белка. Идея метода состоит в замене одной аминокислотой в цепочке аланином и наблюдении, как это повлияло на свойства белка - и далее по всем позициям в белке. Если при замене аминокислоты в какой-либо позиции свойство улучшились, то для позиции, в которой это произошло, среди аминокислот и ищем ту, при подстановке которой улучшение экстремально.
У ala-scan есть один недостаток: при большой длине белка существенно увеличивается сложность метода, появляется необходимость фильтровать данные и проводить ala-scan не по всем позициям, а выборочно.
Поэтому задача решалась путем фильтрации входных данных перед применением теоретического ala-scan для улучшения структуры известного белка (а именно лучшей сцепленности между двумя парами цепочек). Была поставлена задача: для пары цепочек в протеине научиться определять, какие пары аминокислот в цепочках сцеплены между собой хорошо или плохо.
Написан набор классов, решающих следующие задачи:
- Чтение цепочки аминокислот в формате Protein Data Bank.
- Построение трехмерной триангуляции Делоне (написана интерактивная версия алгоритма) для каждой из прочитанных цепочек.
- Для пары поверхностей, приближенных трехмерными триангуляциями и соответствующих паре цепочек, определение пар самых близких и самых удаленных пар точек (с использованием расстояния Хаусдорфа).
Были написаны тесты, подтверждающие корректность работы классов.