BroadPeaks - ре-имплементация алгоритма SICER для определения пиков в соответствующих экспериментах ChIP-Seq.

При обработке данных экспериментов ChIP-Seq одной из чувствительных проблем является определение пиков (peak calling). 

Существует ряд алгоритмов и программ, которые можно условно разделить на две группы - определители для узких и широких пиков. 

Де-факто стандартной программой для узких пиков является MACS. 

Стандартных программ для широких пиков на данный момент не существует, однако одной из самый простых и эффективных является программа SICER. К сожалению, программа SICER обладает рядом существенных недостатков, и в данный момент практически не поддерживается. 

Таким образом, данный проект преследует следующие цели:

  1. Разработать эффективный способ расчета оценки mappability score для прочтений длины N
  2. Воплотить алгоритм, используемый в SICER, в упрощенном и практичном виде, используя Python и NumPy/SciPy. 
  3. Провести обширное тестирование программы на данных ChIP-Seq в ряде модельных организмов, и определить оптимальную стратегию определения пиков в случае 1) отсутствия 2) присутствия контрольного эксперимента
  4. Провести поиск статистических зависимостей результатов работы определителя пиков от аннотации генома.
Куратор:
   Александр Предеус
Время выполнения проекта: Jun 2015 — Aug 2015
Файлы: