Оценка качества транскриптомных сборок
В ходе проекта были рассмотрены статьи об уже существующих транскриптомных сборщиках. На основе предложенных авторами статей метрик, для оценки качества транскриптомной сборки была разработана утилита Trans-QUAST, получающая статистики покрытия аннотированных генов и экзонов.
Trans-QUAST работает в четырех режимах в зависимости от начальных данных:
- psl файл с выравниванием и gtf файл с аннотацией;
- gtf файл с аннотацией, fasta файлы с транскриптами и референсным геномом;
- gtf файл с аннотацией, fastq файл с ридами, fasta файл с референсным геномом;
- gtf файл с аннотацией и fasta файл с референсным геномом.
Разработанная утилита тестировалась на геноме дрожжей, в будущем планируется рассмотреть большие геномы и геномы, содержащие fusion гены и другие особенности. Также Trans-QUAST будет тестироваться на различных сборщиках (Trinity, Scripture, Oases, Cufflinks) и симуляторах fastq данных (flux, dwgsim, BEERS).
Время выполнения проекта:
Feb 2014 — May 2014