- 1 из 11
- ››
Первая российская работа по полногеномному секвенированию человека была выполнена в 2009 году в Лаборатории геномики Курчатовского НБИК-Центра. Основной особенностью этой работы является факт комбинирования двух технологических платформ — Genome Analyzer II (Illumina) и SOLiD™ (Applied Biosystems).
Обработка и анализ полученных данных проводились на вычислительном кластере РНЦ «Курчатовский институт». Использовалось программное обеспечение, предоставленное производителями оборудования, равно как и доступное на правах open-source, а также собственные разработки.
Все результаты экспериментов по секвенированию генома человека, проведённых в рамках проекта "Русский геном", доступны для свободной загрузки в базе данных Sequence Read Archive NCBI:
В процессе подготовки находятся результаты работы прикладных программ (картирование чтений и определение SNP), а также данные по секвенированию мРНК.
С помощью программного пакета Corona Lite была получена полная консенсусная последовательность митохондриального генома, среднее покрытие которой чтениями составило 291. Картирование производилось на референсную последовательность митохондриальной ДНК rCRS (revised Cambridge Reference Sequence, номер в GenBank: NC_012920, принадлежит к гаплогруппе H2). В результате сравнения реконструированной последовательности с референсной была установлена её принадлежность к гаплогруппе U5a, одной из наиболее распространённых в европейской части России.
Были проанализированы возможные варианты взаимного расположения и направления парно-концевых чтений. Первый и основной вариант — чтения картируются на референсный геном в соответствии с логикой приготовления библиотеки. Для платформы GAII это означает, что два чтения ориентированы навстречу друг другу (т.е., 5'→3' и 5'←3'). Для SOLiD же стандартом являются сонаправленные чтения (5'→3' и 5'→3'). Второй и третий варианты — это отход от нормального расположения, возможный в том случае, если исследуемый геном имеет существенные перестройки в рассматриваемом районе — тогда порядок чтений будет нарушен один или два раза, соответственно.
Показано распределение плотности покрытия генома полученными на обоих платформах данными. По оси абсцисс отложена средняя плотность покрытия (сколько чтений картировалось поверх каждого нуклеотида), по оси ординат представлено количество полукилобазных фрагментов с данным покрытием.
Представлен график зависимости количества парных чтений от длины референсной последовательности (длины вставки, insert size), находящейся между ними. Картирование производилось на референсный геном человека hg18, для данных платформы GAII использовался Eland, для данных платформы SOLiD — BWA.