В 1971-м Сэнгер начал разрабатывать технологию секвенирования генов на основе копирующей реакции ДНК-полимеразы. (В Гарварде Уолтер Гилберт и Аллан Максам тоже создавали систему чтения ДНК, но с другими реактивами. Их способ работал, но его быстро вытеснил метод Сэнгера.) На первых порах метод Сэнгера был малоэффективным и часто не срабатывал по необъяснимым причинам. Одна из причин проблемы заключалась в слишком высокой скорости реакции копирования: полимераза мчалась вдоль участка ДНК, добавляя нуклеотиды в таком умопомрачительном темпе, что Сэнгер не успевал делать промежуточные шаги. В 1977-м ученый внес остроумное изменение: он застопоривал реакцию с помощью добавки химически модифицированных нуклеотидов. Они мало отличались от А, Ц, Г и Т, так что полимераза их еще узнавала и встраивала, но продолжать копирование после них уже не могла. Сэнгер составлял карту гена, ориентируясь на точки застревания полимеразы – тут А, там Т, здесь Г, и так далее – все тысячи нуклеотидов ДНК[635].

24 февраля 1977 года в журнале Nature вышла статья[636] Сэнгера о том, как он с помощью своей технологии целиком определил последовательность одноцепочечной ДНК вируса ΦX174. Это был крошечный бактериальный вирус длиной всего 5386 нуклеотидов – весь его геном размером уступал некоторым из самых коротких генов человека, – но та публикация знаменовала поистине переломный научный прорыв. «В последовательности выявляются характерные участки[637], отвечающие за производство белков девяти известных генов организма», – писал Сэнгер. Он научился читать язык генов.

Новые генетические методики – секвенирование и молекулярное клонирование – незамедлительно пролили свет на ранее неизвестные характеристики генов и генома. Первое и самое удивительное открытие касалось уникальной особенности генов животных и вирусов животных. В 1977 году ученые Ричард Робертс и Филлип Шарп[638] независимо друг от друга обнаружили, что животные белки чаще всего кодируются не длинными непрерывными последовательностями ДНК, а совокупностью отдельных модулей. У бактерий каждый ген – это единый, цельный участок ДНК, который начинается со старт-кодона (АТГ) и не прерывается до финального сигнала «стоп». Бактериальные гены не состоят из модулей, разделенных промежутками. А у животных и их вирусов, как показали Робертс и Шарп, гены обычно разбиты на отрезки, перемежающиеся длинными, ничего не значащими «прокладками».

В качестве аналогии рассмотрим слово «структура». У бактерии ген представлен в геноме именно в таком виде – структура, – без разрывов, промежутков, вставок и пауз. В геноме же человека это слово прерывается промежуточными последовательностями ДНК: ст… ру… к… т… ур… а.

Протяженные участки ДНК, обозначенные многоточиями (…), не несут никакой информации о белке. После транскрипции такого прерывистого гена – то есть после построения по ДНК РНК-послания – все «прокладки» из мРНК вырезаются, и целостность послания восстанавливается уже без ненужных, бессмысленных участков: ст… ру… к… т… ур… а превращается в просто структура. Позже Робертс и Шарп придумали для этого процесса название – сплайсинг генов, или сплайсинг РНК[639] (от английского слова, означающего «сращивать», потому что после удаления промежутков концы оставшихся фрагментов РНК сращиваются).

Поначалу прерывистая структура генов озадачила ученых: почему гено́м животных тратит столько ДНК на разделение кусочков гена, а потом все равно сшивает эти кусочки в цельное РНК-послание? Но вскоре внутренняя логика этого явления стала понятной: поделив ген на модули, клетка может, комбинируя их, собирать разные РНК-сообщения (а затем и белки) на базе единственного гена. Из слова ст… ру… к… т… ур… а можно сшить и рука, и кура, и что-нибудь еще, создав таким образом много разных сообщений – «изоформ» – по последовательности одного и того же гена. Из слова г… е… н… ом с помощью сплайсинга можно сотворить слова ген, гном и ом. У модульного генома есть и эволюционное преимущество: если соединить отдельные модули разных генов, можно получить совершенно новые гены (ст… е… н… а).

Уолтер Гилберт, генетик из Гарварда, придумал для генных модулей специальное слово – экзоны. Промежуточные, вырезаемые, участки назвали интронами. Для генов человека интроны не исключение, а правило. Человеческие интроны часто огромны: они могут простираться на сотни тысяч нуклеотидов. Сами гены тоже отделены друг от друга длинными участками межгенной ДНК. Считается, что в межгенной ДНК и внутригенных интронах содержатся те самые последовательности, которые определяют контекст для регуляции генов. Если вернуться к нашей аналогии, то межгенную ДНК можно изобразить как длинные многоточия, по которым то тут, то там разбросаны знаки препинания. Тогда геном человека можно представить так:

Перейти на страницу:

Похожие книги