Манолис Келлис. M. Скотт Брауэр
Секвенирование генома человека заложило основу для изучения генетической изменчивости и ее связи с широким спектром заболеваний. Но сам геном – это только часть истории, поскольку гены можно включать и выключать с помощью ряда химических модификаций, известных как "эпигенетические метки."
Теперь, спустя десятилетие после того, как геном человека был секвенирован, Консорциум эпигеномики Дорожной карты Национальных институтов здравоохранения создал аналогичную карту эпигенома человека.
Манолис Келлис, профессор информатики и член Лаборатории компьютерных наук и искусственного интеллекта Массачусетского технологического института и Института Броуда, возглавил работу по интеграции и анализу наборов данных, созданных в рамках проекта, которые представляют собой наиболее полное представление об эпигеноме человека для Дата.
В статье, опубликованной сегодня в журнале Nature, Келлис и его коллеги сообщают о 111 эталонных человеческих эпигеномах и изучают их регуляторные схемы, чтобы понять их роль в человеческих чертах и заболеваниях.
"Консорциум задался целью систематически охарактеризовать эпигеномный ландшафт человека в различных тканях и типах клеток," Келлис говорит. "Учитывая масштабность задачи, это означало объединение нескольких центров картирования и профилирование широкого спектра образцов клеток и тканей, чтобы охватить разнообразие эпигенома человека."
150 миллиардов геномных последовательностей
Исследователи создали 2805 наборов данных по всему геному, охватывающих в общей сложности 150 миллиардов операций секвенирования, что соответствует 3174-кратному охвату генома человека. Эти захваченные модификации как самой ДНК, так и гистоновых белков, вокруг которых обернута ДНК, образуют структуру, известную как хроматин.
Затем Келлис и его команда разработали и применили алгоритмы машинного обучения, которые могли преобразовывать эти наборы данных в справочную карту для каждого из 111 типов клеток и тканей. Алгоритмы различали разные классы эпигеномных модификаций и использовали их для аннотирования участков генома, активных в каждом образце, и, в частности, регуляторных элементов, которые контролируют, где и когда экспрессируются разные гены.
"Различные комбинации эпигенетических меток характеризуют разные области генома, отражая определенные функции, которые они играют в каждой клетке," Келлис говорит. "Систематически изучая эти комбинации, мы можем изучить язык эпигенома и то, что он говорит нам об активности и функции каждой области генома в каждом из типов клеток."
Исследователи выделили 15 различных эпигеномных сигнатур или состояний хроматина, отражающих активные, подавленные, уравновешенные, транскрибируемые и неактивные области генома в каждом типе клеток. Около 5 процентов каждого эталонного эпигенома демонстрировали сигнатуры, связанные с регуляторной функцией.
"Состояния хроматина позволили нам суммировать сложность различных эпигеномных меток в небольшое количество общих паттернов," Келлис говорит. "Тогда мы могли бы интерпретировать биологические функции этих паттернов."
Эпигеномная динамика
Затем исследователи изучили, как эти состояния хроматина варьируются в разных типах клеток и тканей. Это позволило им сгруппировать типы клеток со схожей регуляторной схемой. Они также сгруппировали регуляторные области, которые активны в одних и тех же типах клеток. Таким образом, они могут начать раскрывать строительные блоки регулирующих схем.
"В отличие от генома, который в основном не изменяется для разных типов клеток, эпигеном чрезвычайно динамичен, отражая специализацию каждого типа клеток, таких как нейроны, сердце, мышцы, печень, кожа, кровь или иммунные клетки," Келлис говорит. "Изучая, какие участки включаются и выключаются в одних и тех же типах клеток, мы можем получить представление о регуляции генов."
Исследователи сгруппировали 2 миллиона предсказанных регуляторных областей в 200 наборов или модулей, которые, по-видимому, действуют скоординированно в разных типах клеток. Они обнаружили, что 100 из этих модулей содержат общие паттерны последовательностей, известные как регуляторные мотивы, которые могут быть ответственны за их способность работать вместе таким образом.
"Использование предсказанных регуляторов и их мотивов может помочь проанализировать схемы различных тканей и клеток," Келлис говорит.
Исследователи также сравнили эти эпигеномные сигнатуры с группами генетических вариантов, которые связаны с различными человеческими особенностями и заболеваниями. Это позволило им составить карту типов тканей и клеток, которые наиболее актуальны для каждого признака или заболевания.
"Мы обнаружили, что генетические варианты обнаруживаются в регуляторных областях, известных как энхансеры, которые активируются только в определенных типах клеток и тканей," Келлис говорит. "Это говорит о том, что многие генетические варианты влияют на регуляторную схему клетки, возможно, нарушая функции генов, изменяя уровни тканеспецифической экспрессии генов."
Тканевые энхансеры влияют на 58 признаков
Исследователи обнаружили значительные тканеспецифичные сигнатуры энхансеров для генетических вариантов, связанных с 58 различными признаками. К ним относятся рост в эмбриональных стволовых клетках; рассеянный склероз в иммунных клетках; синдром дефицита внимания в тканях головного мозга; артериальное давление в тканях сердца; глюкоза натощак в островках поджелудочной железы; холестерин в ткани печени; и болезнь Альцгеймера в моноцитах CD14.
"Этот беспристрастный взгляд позволяет исследователям сосредоточиться на соответствующих клетках и тканях, которые в противном случае могли бы быть упущены из виду при изучении конкретного заболевания," Келлис говорит. "Контур регуляции разнообразных клеток может способствовать возникновению заболеваний, которые проявляются в неожиданных, на первый взгляд, органах."
По словам Келлиса, использование этих схем для понимания молекулярной основы человеческих заболеваний потребует многих лет и усилий многих лабораторий. "Наши результаты представляют собой бесценную карту и богатый набор гипотез, которые могут помочь в проведении этих исследований."
Вольф Рейк, руководитель программы исследований эпигенетики в Институте Бабрахама в США.K., который не принимал участия в исследовании, говорит, что проект является интересным ресурсом для биомедицинского сообщества во всем мире.
.
"Важные эпигенетические метки систематически картировались во многих типах клеток и тканях человека," Рейк говорит. "Интегративный анализ этих эпигеномов дает глобальную карту для понимания фундаментальных процессов развития и болезней у людей."
