ENCODE - это энциклопедия элементов ДНК. Энкод был запущен в 2003 году для идентификации всех функциональных элементов (рабочих битов) в геноме человека. Работы выполнены более чем 400 учеными в 32 лабораториях США, Великобритании, Испании, Сингапура и Японии. Их результаты были опубликованы в 30 статьях с открытым доступом в трех журналах - "Nature", "Genome Biology" и "Genome Research". Это наиболее подробный анализ генома человека на сегодняшний день.

Упрощенное изложение их основных выводов выглядит следующим образом:

  1. Только 1% кодов генома для белков. Это около 21 000 генов.
  2. Код 70,000 последовательностей для "промоторных" регионов. Они находятся выше по течению от генов, где белки связываются, чтобы контролировать экспрессию генов.
  3. Существует около 400 000 "усиливающих" регионов, которые регулируют удаленные гены.
  4. Есть четыре миллиона генных "переключателей". Это последовательности ДНК, которые контролируют, когда гены включены или выключены. Часто они далеки от гена, который они контролируют.
  5. Около 80% генома имеет определенную биохимическую функцию. Мысль о том, что большая часть ДНК - это "мусорная ДНК", определенно ошибочна. "Подавляющее большинство генома человека не кодирует белки и до сих пор, похоже, не содержало определенных генов-регуляторов". Почему эволюция сохранила большое количество "бесполезной" ДНК, оставалась загадкой и казалась расточительной. Оказывается, однако, что есть веские основания для сохранения этой ДНК. Результаты проекта ENCODE показывают, что большинство из этих участков ДНК представляют собой порты, связывающие белки и молекулы РНК, приводя их в позиции, с которых они взаимодействуют друг с другом для регулирования функции и уровня экспрессии белков-кодирующих генов".
  6. Эволюция вызвана как изменениями в генах, кодирующих белки, так и в ДНК, кодирующей регуляторный контроль.

"Одна из больших проблем в эволюционной биологии заключается в том, чтобы понять, как различия в последовательности ДНК между видами определяют различия в их фенотипах. Эволюционные изменения могут происходить как за счет изменений в белковых кодирующих последовательностях, так и за счет изменений в последовательностях, которые изменяют генную регуляцию".

Методы, использованные для работы, включали в себя:

  1. Они выделили и секвенировали РНК, транскрибированную из генома.
  2. Они определили места для переплета около 120 транскрипционных продуктов.
  3. Они исследовали закономерности химической модификации гистонов. Это было сделано для того, чтобы найти области, в которых экспрессия генов усиливается или подавляется.
  4. Они провели 1648 экспериментов на 147 типах клеток.

Новости, связанные с этой работой: