Анализ вариантов взаимного расположения и направления парно-концевых чтений

Были проанализированы возможные варианты взаимного расположения и направления парно-концевых чтений. Первый и основной вариант — чтения картируются на референсный геном в соответствии с логикой приготовления библиотеки. Для платформы GAII это означает, что два чтения ориентированы навстречу друг другу (т.е., 5'→3' и 5'←3'). Для SOLiD же стандартом являются сонаправленные чтения (5'→3' и 5'→3'). Второй и третий варианты — это отход от нормального расположения, возможный в том случае, если исследуемый геном имеет существенные перестройки в рассматриваемом районе — тогда порядок чтений будет нарушен один или два раза, соответственно.

В соответствии с этими определениями все парные чтения были отнесены к трем классам: «нормальные», «с одной инверсией» и «с двумя инверсиями». Те чтения, которые картируются на разные хромосомы референсного генома, описаны отдельно. Небольшой избыток чтений, картируемых на разные хромосомы в случае SOLiD объясняется присутствием этапа лигирования тупых концов фрагментов и двуцепочечных олигонуклеотидов, что потенциально создает возможность ковалентного соединения двух фрагментов с разных хромосом. В целом, процент аномально ориентированных чтений приблизительно одинаков у двух платформ.

    GAII SOLiD
Парный фрагмент картируется на другую хромосому 3,18% 4,56%
Взаимное расположение парных ридов: Нормальное 96,12% 95,22%
Подразумевается инверсия 0,48% 0,14%
Подразумевается двойная инверсия 0,22% 0,07%
Размер вставки находится в допустимом диапазоне 93,06% 95,43%