Задача проекта состояла в том чтобы расширить пайпалайн сборки в SPAdes, а именно добавить функциональность позволяющую упростить граф Де Брёйна до того как начнется его сжатие.
В результате, на основе структур данных, уже реализованных в SPAdes, был разработан Erroneous Connection Remover, удаляющий большое количество коротких, плохо покрытых путей в несжатом графе Де Брёйна, что позволило освободить значительное количество ресурсов и ускорить общее время сборки генома.