Новый многоаспектный метод исследует, как некодирующая ДНК влияет на экспрессию генов

Предоставлено: Susanna M. Гамильтон, Broad Communications

Примерно 98 процентов генома человека состоит из некодирующей ДНК, включая энхансеры, промоторы и другие элементы, регулирующие активность генов. Методы изучения этих регионов, как правило, дорогие, трудоемкие и в основном малопроизводительные.

Однако, чтобы действительно понять функциональную географию некодирующего генома, исследователям нужен способ изолировать и охарактеризовать тысячи и миллионы регуляторных элементов ДНК в нем одновременно, быстро и с высоким разрешением. Потребность в этом огромна, поскольку более 90 процентов вариантов, выявленных в ходе полногеномных ассоциативных исследований признаков и заболеваний, находятся в некодирующей ДНК.

Объединив два мощных анализа на основе секвенирования с инструментом на основе машинного обучения, исследовательская группа под руководством Синчена Ванга и ассоциированных членов Мелины Клауснитцер и Манолис Келлис в программах Broad’s Metabolism и Epigenomics, соответственно, разработала новый мощный подход к измерению индивидуального способность некодирующих сегментов ДНК контролировать экспрессию генов, причем как в массовом масштабе, так и с высоким разрешением.

Этот подход, получивший название HiDRA (для анализа регулирующей деятельности с высоким разрешением), объединяет ряд широко используемых инструментов:

  • ATAC-seq (анализ доступного для транспозаз хроматина с высокопроизводительным секвенированием), метод, разработанный ассоциированным членом Броуда Джейсоном Буэнростро, который просматривает весь геном в поисках раскрученных, транскрибируемых участков ДНК;
  • STARR-seq (Self-Transcribing Active Regulatory Region Sequencing), анализ, разработанный сотрудником лаборатории Kellis Александром Старком для измерения активности, способствующей экспрессии некодирующих сегментов ДНК; а также
  • SHARPR-RE, алгоритм машинного обучения, основанный на инструменте SHARPR, разработанный лабораторией Келлиса для анализа данных массово-параллельных репортерных анализов.
  • Основываясь на этих подходах, HiDRA позволяет исследователям создавать огромные библиотеки регуляторной ДНК и изучать их влияние на экспрессию генов с разрешением на уровне нуклеотидов.

    Как они сообщили в Nature Communications, команда применила HiDRA к линии клеток крови, чтобы проверить около семи миллионов некодирующих фрагментов ДНК на те, которые регулируют экспрессию генов, в конечном итоге идентифицировав 65000. Сюда входят сегменты, четко обозначенные как энхансеры и промоторы, а также сегменты без таких меток, что позволяет предположить, что геном может содержать дополнительные виды элементов, контролирующих экспрессию, которые нам еще предстоит обнаружить.

    Кроме того, команда использовала HiDRA, чтобы изучить, как варианты ДНК риска заболевания в регуляторных элементах влияют на экспрессию генов по сравнению с вариантами, которые не повышают риск – благо для исследователей, стремящихся изучить, как незначительные вариации последовательностей в промоторах и энхансерах могут влиять на человеческие черты и болезни. состояния.

    Результаты исследования показывают, что HiDRA – это обобщаемый метод анализа нюансов регуляции генов и роли, которую различные функциональные элементы играют в заболеваниях человека.