Обработка результатов BLAST, chaining, netting

Сlustering_and_ordering – простой инструмент, позволяющий обрабатывать результаты BLAST и, увеличивая размер выровненных на референс фрагментов, уточнять их местоположение в геноме. В BLAST подается референсный геном и набор контигов, входными данными для сlustering_and_ordering является вывод BLAST в шестом формате. По окончанию работы программы выдается список упорядоченных по координатам в референсе объединенных фрагментов, их характеристики, а также статистики, позволяющие оценить качество полученных данных.

Алгоритм отбирает фрагменты каждого из контигов, выровненных на некоторую хромосому, после чего фрагменты сортируются в соответствии с координатами их начал в референсе и, в порядке их вхождения в отсортированный индексный массив проверяется выполнение некоторого критерия: удовлетворяющие этому критерию фрагменты объединяются, и происходит изменение текущих значений начала и конца получаемого фрагмента. В дальнейшем планируется научиться собирать геномы, используя полученные с помощью сlustering_and_ordering данные.

Студент:
   Елена Бушманова
Куратор:
   Павел Добрынин
Время выполнения проекта: Sep 2013 — Dec 2013