Определение родственных связей по данным генотипирования
Аппарат обнаружения близкородственных связей достаточно хорошо развит, чего нельзя сказать о поиске родственников 3-10 поколений. Компания 23&me предложила алгоритм, определяющий степень родства двух индивидов по количеству и суммарной длине IBDhalf сегментов, то есть определенных участков хромосом, которые предположительно "пришли" от общего предка. Однако данный метод является не очень точным.
Задача состояла в том, чтобы получить аппроксимации распределений количества сегментов и их длин в каждом поколении и реализовать алгоритм, определяющий степень родства на основе теста отношения правдоподобий, что и было сделано.
Также в ходе работы были реализованы алгоритмы симуляции родословной и вычисления IBDhalf сегментов.