Подготовка к летней школе 2017

Программное обеспечение

Для участия в семинарах и проектах будет необходимо установить ряд программных пакетов.  

Для всех операционных систем

  • R и RStudio  (для семинаров по статистике и R)
  • PyCharm (для практик по Python)
  • Anaconda (для семинаров и работы над некоторыми проектами)

Для компьютеров под управлением Windows

  • Putty — аналог командной строки Linux или виртуальная машина — VirtualBox 
  • Также настойчиво рекомендуем пройти первую неделю курса «Введение в Linux»  

Для компьютеров под управлением Linux и OS X

Программное обеспечение для практических занятий

Для общих практик

  • admixture
  • plink
  • VCFTOOLS
  • BCFTOOLS

Практики для биологов

  • пакеты для R:  randomForest, xgboost, kernlab, limma, caret, pheatmap,  GOsummaries, ggplot2, amap, dplyr, nortest, ellipse, multcomp, mutoss, mutossGUI, nparcomp, coin, perm, multcompView, MASS, reshape2, class, Rtsne, pheatmap, dbscan.

Для установки достаточно в RStudio запустить строчку: install.packages(c('randomForest', 'xgboost', 'kernlab', 'caret', 'pheatmap', 'ggplot2', 'amap', 'dplyr', 'reshape', 'multcomp', 'mutoss', 'mutossGUI', 'nparcomp', 'coin', 'perm', 'multcompView','MASS', 'reshape2', 'class', 'Rtsne', 'pheatmap', 'dbscan'))

# для пакетов mutoss и mutossGUI требуются пакеты, которые необходимо загрузить из bioconductor:

source("https://bioconductor.org/biocLite.R")

biocLite("multtest")

biocLite("qvalue")

# после их установки можно спокойно запускать установку mutoss и mutossGUI

install.packages("mutoss", dependencies = T)

install.packages("mutossGUI", dependencies = T)

  • пакеты для Python: matplotlib, scikit-learn, numpy, seaborn, snakemake

Практики для информатиков

Все необходимое программное обеспечение можно будет установить на школе.


Информатикам

I. Глоссарий основных биологических терминов

II. Вводные лекции и статьи

  1. Введение в молекулярную биологию и биоинформатику (Николай Вяххи). Первая лекция курса «Алгоритмы в биоинформатике», доступного в записи на «Лекториуме». Объясняются самые-самые основы биологии, нужные информатикам, а также рассказывается о ее основных разделах. 
  2. Введение в биоинформатику и Биоинформатика и ее приложения (Алла Лапидус). Интересные лекции с прошлых летних школ о том, что такое биоинформатика и для чего она нужна.
  3. Биоинформатика как наука (Михаил Гельфанд). Один из основоположников биоинформатики в России рассказывает в интервью о том, кто такие биоинформатики и чем они занимаются. На «ПостНауке» можно найти также и другие интересные и довольно простые материалы Михаила Гельфанда.
  4. Геномика: постановка задачи и методы секвенирования (Сергей Николенко). В статье кратко рассказывается об основных методах и задачах биоинформатики с точки зрения геномики. Даются определения самых важных терминов.
  5. Биоинформатика (Андрей Миронов). Конспект лекции из курса по основам биологии, который читают на факультете молекулярной и биологической физики в МФТИ. 

III. Rosalind: онлайн-задачник по биоинформатике:

Задачи под кодовыми названиями DNA, RNA, Revc, GC, Prot, Subs и Hamm.


Биологам

I. Глоссарий основных биоинформатических терминов

II. Программирование

Полезные базовые уроки из онлайн-курса «Программирование на Python»**

базовые темы будут также освещены на семинаре «Введение в программирование на Python».

  1. Общая информация о курсе
  2. Введение
  3. iPython
  4. Операции с целыми числами
  5. Операции с вещественными числами
  6. Типы данных
  7. Переменные; стандартный ввод-вывод

Rosalind: онлайн-задачник по биоинформатике

Python Village, а также задачи под кодовыми названиями DNARNA и Revc.

III. Linux

Полезные базовые уроки из онлайн-курса «Введение в Linux»**

  1. Общая информация о курсе
  2. Как установить Linux
  3. Осваиваем Linux
  4. Terminal, основы
  5. Запуск исполняемых файлов

И биологам, и информатикам

I. Статистика и язык R

базовые темы будут также освещены на занятиях по основам статистики для биологов.

Полезные базовые уроки из онлайн-курса «Основы статистики»**

  1. Общая информация
  2. Генеральная совокупность и выборка
  3. Типы переменных
  4. Меры центральной тенденции
  5. Меры изменчивости

Язык R

  1. http://tryr.codeschool.com — краткое введение в R
  2. https://stepik.org/129 — курс по анализу данных в R от Института биоинформатики**

II. Дополнительно

  1. Материалы летней школы по биоинформатике 2014
  2. Материалы летней школы по биоинформатике 2013
  3. Онлайн-курсы Института биоинформатики