Биоинформатика, 2010-2011

Курс: Биоинформатика.

Преподаватель: Юрий Порозов.

Даты: Sep 2010 — Feb 2011.


Современная биоинформатика – весьма молодая, бурно развивающаяся и довольно непривычная для математиков и информатиков наука. По сути это собрание различных математических моделей и методов в помощь биологам (в основном молекулярным биологам) для решения чисто биологических задач (предсказание пространственной структуры белков, расшифровка структуры ДНК, хранение, поиск и аннотация биологической информации и т.п.) Несмотря на наличие корня «информатика» в названии этой науки, она настолько пропитана биологией, что без довольно глубоких биологических знаний делать математику в ней нечего. В то же время область приложения математических знаний, в том числе и самых современных математических теорий здесь просто необъятна.

Цель курса - познакомить слушателей с основными моделями и методами биоинформатики, а также с основными стоящими перед ней проблемами.

Программа (20 часов):

  1. Введение.
    Предмет биоинформатики. Цели, задачи и методы науки. Основные понятия. Аминокислоты, их строение, свойства. Нуклеиновые кислоты и нуклеотиды. ДНК и РНК. Строение ДНК. Способы представления информации о последовательностях – форматы записи Fasta, Genbank, PDB и способы визуализации. Источники информации, базы данных и Интернет для биоинформатики. Протеины, пространственное строение, функции.
  2. ДНК. Методы анализа последовательностей.
    Молекула ДНК – хранилище генетической информации. Строение ДНК. Упаковка молекулы. Комплементарность. Гены, регуляторные последовательности, сайты связывания. Кодирование информации при помощи нуклеотидов. Репликация (удвоение молекулы). Анализ последовательностей. Парное выравнивание. Алгоритм Смит-Ватерман. Алгоритм Нидлмана-Вунша. Множественное выравнивание. Применение выравнивания в биоинформатике, примеры.
  3. Белки.
    Строение белков. Первичная структура белка. Вторичная структура. Третичная и четвертичная структура белка. Мотивы и домены. α-структуры,  β-структуры и их комбинации. Функции белков. Связь между структурой и функцией белков. Главная цепь. Боковые цепи. Геометрия главной цепи. Конформации белка. Конформации боковых цепей. Диаграмма Рамачандран и библиотеки ротамеров.
  4. Биологические базы данных и серверы. Решение практических задач.
    NCBI и сервисы. PDB. OCA. SRS. SRS-3D. PredictProtein. Swiss-Model. ExPASy. UniProt. Сервера EMBL. Сервер ENCODE project. Инструменты: Swiss-PDBviewer, VMD, Accelrys Discovery Studio. Каждый из приведенных сервисов и программных продуктов могут служить базой и рассмотрены на отдельных workshops / мастер-классах / how-to-do классах.
  5. Актуальные проблемы, требующие решения: аннотация генома, поиск генов, поиск сайтов репликации у человека. Сворачивание белков, предсказание структуры белка, предсказание функции и клеточной локализации белков. Предсказание подвижности белков и классификация протеинов по принципу подвижности.

Материалы: