К-меры в геноме одного вида, секвенирванного разными платформами (мышь/дрожжи)

В последовательности нуклеотидов k-меры - подпоследовательности длины k. Подсчёт вхождений таких подпоследовательностей является главным этапом в некоторых алгоритмах геномной сборки и нуклеотидного выравнивания. Цель нашей работы - сравнение состава k-меров в геномах, просеквенированных разными платформами. На примере двух модельных организмов - дрожжей и мыши - проанализирован спектр к-меров, их состав и уникальность. Сравнение Roche 454 и Illumina платформ позволило оценить количество ошибок, вносимых разными технологиями секвенирования. Кроме того, оказалось, что данные по GC составу для одного и того же генома, просеквенированного разными технологиями, значительно отличаются друг от друга.

Время выполнения проекта: Sep 2013 — Dec 2013