Распределение плотности покрытия генома

Показано распределение плотности покрытия генома полученными на обоих платформах данными. По оси абсцисс отложена средняя плотность покрытия (сколько чтений картировалось поверх каждого нуклеотида), по оси ординат представлено количество полукилобазных фрагментов с данным покрытием.
Для его построения референсный геном разбивался на последовательные фрагменты длиной 500 п.н., затем из данных картирования (Eland для GAII и BWA для SOLiD) вычислялось количество чтений, приходящихся на каждый такой фрагмент. Для вычисления плотности покрытия это число умножалось на длину чтения (36 для GAII и 25 для SOLiD) и нормировалось на 500. Оказалось, что для данных, полученных на GAII, такой график имеет форму распределения Максвелла с пиком на семикратном покрытии. Следует отметить, что хвост распределения смещается до значений покрытия порядка десятка тысяч. Такие аномально плотно покрытые последовательности в основном представляли собой центромерные районы. Анализ понуклеотидного покрытия показал, что данные, полученные на платформе GAII, покрывают хотя бы один раз 66,03% генома или 2 033 881 571 нуклеотид.