De Bruijn graph simplification based on perfect hashing
Задача проекта состояла в том чтобы расширить пайпалайн сборки в SPAdes, а именно добавить функциональность позволяющую упростить граф Де Брёйна до того как начнется его сжатие.
В результате, на основе структур данных, уже реализованных в SPAdes, был разработан Erroneous Connection Remover, удаляющий большое количество коротких, плохо покрытых путей в несжатом графе Де Брёйна, что позволило освободить значительное количество ресурсов и ускорить общее время сборки генома.
Время выполнения проекта:
Sep 2015 — Dec 2015