Оценка качества транскриптомных сборок

В ходе проекта были рассмотрены статьи об уже существующих транскриптомных сборщиках. На основе предложенных авторами статей метрик, для оценки качества транскриптомной сборки была разработана утилита Trans-QUAST, получающая статистики покрытия аннотированных генов и экзонов.

Trans-QUAST работает в четырех режимах в зависимости от начальных данных:

  • psl файл с выравниванием и gtf файл с аннотацией;
  • gtf файл с аннотацией, fasta файлы с транскриптами и референсным геномом;
  • gtf файл с аннотацией, fastq файл с ридами, fasta файл с референсным геномом;
  • gtf файл с аннотацией и fasta файл с референсным геномом.

Разработанная утилита тестировалась на геноме дрожжей, в будущем планируется рассмотреть большие геномы и геномы, содержащие fusion гены и другие особенности. Также Trans-QUAST будет тестироваться на различных сборщиках (Trinity, Scripture, Oases, Cufflinks) и симуляторах fastq данных (flux, dwgsim, BEERS).

Студент:
   Елена Бушманова
Время выполнения проекта: Feb 2014 — May 2014