В 1971-м Сэнгер начал разрабатывать технологию секвенирования генов на основе копирующей реакции ДНК-полимеразы. (В Гарварде Уолтер Гилберт и Аллан Максам тоже создавали систему чтения ДНК, но с другими реактивами. Их способ работал, но его быстро вытеснил метод Сэнгера.) На первых порах метод Сэнгера был малоэффективным и часто не срабатывал по необъяснимым причинам. Одна из причин проблемы заключалась в слишком высокой скорости реакции копирования: полимераза мчалась вдоль участка ДНК, добавляя нуклеотиды в таком умопомрачительном темпе, что Сэнгер не успевал делать промежуточные шаги. В 1977-м ученый внес остроумное изменение: он застопоривал реакцию с помощью добавки химически модифицированных нуклеотидов. Они мало отличались от А, Ц, Г и Т, так что полимераза их еще узнавала и встраивала, но продолжать копирование после них уже не могла. Сэнгер составлял карту гена, ориентируясь на точки застревания полимеразы – тут А, там Т, здесь Г, и так далее – все тысячи нуклеотидов ДНК[635].
24 февраля 1977 года в журнале
Новые генетические методики – секвенирование и молекулярное клонирование – незамедлительно пролили свет на ранее неизвестные характеристики генов и генома. Первое и самое удивительное открытие касалось уникальной особенности генов животных и вирусов животных. В 1977 году ученые Ричард Робертс и Филлип Шарп[638] независимо друг от друга обнаружили, что животные белки чаще всего кодируются не длинными непрерывными последовательностями ДНК, а совокупностью отдельных модулей. У бактерий каждый ген – это единый, цельный участок ДНК, который начинается со старт-кодона (АТГ) и не прерывается до финального сигнала «стоп». Бактериальные гены не состоят из модулей, разделенных промежутками. А у животных и их вирусов, как показали Робертс и Шарп, гены обычно разбиты на отрезки, перемежающиеся длинными, ничего не значащими «прокладками».
В качестве аналогии рассмотрим слово «структура». У бактерии ген представлен в геноме именно в таком виде –
Протяженные участки ДНК, обозначенные многоточиями (…), не несут никакой информации о белке. После транскрипции такого прерывистого гена – то есть после построения по ДНК РНК-послания – все «прокладки» из мРНК вырезаются, и целостность послания восстанавливается уже без ненужных, бессмысленных участков:
Поначалу прерывистая структура генов озадачила ученых: почему гено́м животных тратит столько ДНК на разделение кусочков гена, а потом все равно сшивает эти кусочки в цельное РНК-послание? Но вскоре внутренняя логика этого явления стала понятной: поделив ген на модули, клетка может, комбинируя их, собирать разные РНК-сообщения (а затем и белки) на базе единственного гена. Из слова
Уолтер Гилберт, генетик из Гарварда, придумал для генных модулей специальное слово –