BroadPeaks - ре-имплементация алгоритма SICER для определения пиков в соответствующих экспериментах ChIP-Seq.
При обработке данных экспериментов ChIP-Seq одной из чувствительных проблем является определение пиков (peak calling).
Существует ряд алгоритмов и программ, которые можно условно разделить на две группы - определители для узких и широких пиков.
Де-факто стандартной программой для узких пиков является MACS.
Стандартных программ для широких пиков на данный момент не существует, однако одной из самый простых и эффективных является программа SICER. К сожалению, программа SICER обладает рядом существенных недостатков, и в данный момент практически не поддерживается.
Таким образом, данный проект преследует следующие цели:
- Разработать эффективный способ расчета оценки mappability score для прочтений длины N
- Воплотить алгоритм, используемый в SICER, в упрощенном и практичном виде, используя Python и NumPy/SciPy.
- Провести обширное тестирование программы на данных ChIP-Seq в ряде модельных организмов, и определить оптимальную стратегию определения пиков в случае 1) отсутствия 2) присутствия контрольного эксперимента
- Провести поиск статистических зависимостей результатов работы определителя пиков от аннотации генома.
Время выполнения проекта:
Jun 2015 — Aug 2015
Файлы: