Данные крупнейших человеческих экзомов показывают избыток низкочастотных несинонимичных вариантов кодирования

В статье, опубликованной сегодня в Nature Genetics, международная исследовательская группа сообщила о повторном секвенировании и анализе 200 экзомов человека, установила самый большой набор данных по экзомам человека, опубликованный на сегодняшний день, и выявила избыток низкочастотных вредных несинонимичных генетических мутаций. В коллективную команду входят исследователи из BGI-Shenzhen, Калифорнийского университета в Беркли, Копенгагенского университета и некоторых других европейских институтов.

Команда использовала NimbleGen 2.Массив для захвата 1M экзона для целевого захвата 18 654 кодирующих генома человеческого генома и секвенирование 200 человек из Дании. Средняя глубина секвенирования для каждого экзома составляет 12-кратное покрытие, и около 95% целевых областей были покрыты как минимум 1 чтением. Всего в популяции было выявлено 121870 SNP, около 44% – новые SNP. Было идентифицировано 53081 кодирующий SNP (cSNP), 25 275 синонимичных и 27 806 несинонимичных, из которых 42.6% были новыми.

На основе данных большой популяции был проведен статистический анализ для вызова SNP и рассчитано распределение частот аллелей. Частотный спектр аллелей цСНП с частотой минорного аллеля > 2% было разработано для исключения ложноположительных SNP. Путем сравнения распределения частот аллелей среди несинонимичных и синонимичных cSNPs, 1.Было выявлено 8-кратное превышение вредных несиономиозных над синонимичными cSNP в диапазоне низких частот аллелей от 2 до 5%. Более того, этот избыток был выше для SNP X-хромосомы, что позволяет предположить, что вредные мутации на X-хромосоме в первую очередь рецессивны. Команда далее проанализировала потенциальные эффекты метилирования по частотам аллелей, сравнив частотное распределение сайтов, потенциально затронутых метилированием CpG или конверсией гена, с незатронутыми сайтами, где не было обнаружено сильного эффекта в масштабе всего генома.

«Исследование предоставляет ценный набор данных для изучения частотного спектра аллелей и популяционных генетических паттернов», – сказал доктор Инжруи Ли, исследователь проекта из BGI-Shenzhen. Мы обнаружили больше низкочастотных вредных мутаций в кодирующих областях, чем ожидалось ранее, и большинство из них являются рецессивными, поэтому мы поддерживаем идею о том, что большая часть наследственных вариаций, влияющих на приспособленность, вызвана низкочастотными мутациями.

Ассоциативные исследования выявили лишь ограниченные наследственные вариации, связанные с общими полигенными признаками, а анализ генотипирования обычно не учитывает эффекты низкочастотных мутаций. Результаты, полученные в этом исследовании, дополнительно демонстрируют, что секвенирование экзома является эффективным и многообещающим подходом для выявления генетических вариантов, связанных с человеческими чертами, и изучения популяционной генетики. Команда ожидает, что будущий анализ некодирующих регионов и этнически разнообразных образцов поможет построить полную картину геномной изменчивости человека и понимание взаимодействия между генетическим дрейфом, мутациями, рекомбинацией и отбором в геноме человека.

Ранее статья в журнале Science (Science. 2010 июль; 329 (5987): 75-78) сообщили о секвенировании экзомов 50 тибетцев и нашли доказательства высотной адаптации тибетского населения. Это показывает, что секвенирование следующего поколения находит все больше применений и будет иметь большой потенциал в исследованиях геномики, открытии лекарств и персонализированном лечении.