AU project

Repeat resolution using 10xGenomics data

The recently introduced GemCode technology creates a reagent delivery system that partitions long DNA molecules and prepares sequencing libraries such that all reads that came from the same molecule part share a common barcode. Supposedly, barcode can give us additional information about the location of given sequence. Therefore, barcodes can be used to generate phased haplotype information for human genomes, detect structural variants and interrogate heterogeneous cell populations. But until now no algorithms for genome assembly from this data were published.

Optimization of spectral network parameters

Dereplication is a process of using information about the chemical structure of previously characterized compounds to interpret mass spectra of compounds in an experimental sample. Identification of a Peptidic Natural Product (PNP) from its variants is called variable dereplication and for this process a special data structure called spectral network is used. Spectral network is a graph where two spectra are connected if their similatity score is higher than some threshold.

Сравнительный анализ методов предсказания сайтов редактирования РНК в транскриптоме

РНК-редактирование является важным механизмом диверсификации транскриптома, позволяющим клеткам эукариот варьировать репертуар производимых белков в ответ на изменения внешних условий. Развитие технологий NGS сделало возможным поиск сайтов редактирования в масштабе полного транскриптома, что позволяет исследовать роль этого процесса в патогенезе раковых заболеваний.

Быстрая индексация метагеномов

Наиболее популярным решением задачи сравнения метагеномных образцов на данный момент является использование алгоритмов из семейства Unifrac, что, однако, оказывается неэффективно для решения задачи поиска ближайших соседей (NNS, nearest neighbor search) по заданному образцу в больших базах данных. 

Primer Trimming for Targeted Resequencing

The E92K mutation identified in 9 patients collocated with a primer hybridization site for one of the pair overlapping amplicons covering the 4th exon of the CFTR. This led to an excess of reference nucleotides in the mutation site, which significantly increased probability of wild type nucleotide homozygote and decreased probability of heterozygote, reducing calling quality and mutant allele frequency.


Subscribe to RSS - AU project