Hadoop Optimized de Novo Assembler

В настоящее время большинство de novo ассемблеров собирают геномы в оперативной памяти, что неудобно, поскольку объемы данных могут быть достаточно большими. Поэтому и был поставлен вопрос о реализации de novo ассемблера, основанного на программах типа MPI. В данной работе был выбран фреймворк Hadoop.

Сама работа ассемблера состоит из нескольких этапов, первые два из которых -- построение графа де Брюйна и сжатие путей -- были реализованы в проекте.
Также была проверена правильность работы компонент на небольших тестах.

Студент:
   Виталий Аксёнов
Куратор:
   Максим Михеев
Время выполнения проекта: Sep 2014 — Dec 2014
Файлы:
   aksenov_13112014.pdf