Оценка содержания полигуанинов в геноме мыши

Протяженные гомополимерные участки в геноме могут считаться артефактами секвенирования, которые появляются вследствие ошибок работы полимеразы. В частности, такими артефактами могут быть полигуаниновые треки, т.к. они имеют слишком высокую температуру плавления, могут образовывать вторичные структуры, препятствующие процессам репликации и транскрипции, и кодируют длинные глициновые пептиды, чья структура не стабильна для образования белковых мотивов.

В данной работе было оценено содержание полигуаниновых треков в геноме мыши (Mus musculus). Для поиска треков на собранных хромосомах мыши (GRCm38.p1) была использована программа, написанная на языке Python. Найденные треки были пересечены с выровненными ридами Illumina с помощью программ Bowtie2, SAMtools и BEDtools, а также проанализированы с помощью NCBI Blast. В результате было выявлено 2229 треков, большая часть которых находится в области бактериальных искусственных хромосом (BAC), использовавшихся для сборки генома мыши.

 

Студент:
   Дарья Сергеева
Куратор:
   Павел Добрынин
Время выполнения проекта: Sep 2013 — Dec 2013
Файлы:
   sergeeva_final_21122013.pdf