Формализации, теоретизированию, схемам, дизайну генетического кода посвящена основная, хотя и меньшая по объему, оставшаяся часть книги, к которой Автор сейчас переходит. Первая формальная гипотеза структуры генетического кода представляет собой возможный ответ на вопрос, почему кодируемых аминокислот именно двадцать.
В 1954 году Гамов первым показал, что «при сочетании 4 нуклеотидов тройками получаются 64 комбинации, чего вполне достаточно для записи наследственной информации». Он был первым, кто предположил кодирование аминокислот триплетами нуклеотидов и выразил надежду, что «кто-нибудь из более молодых учѐных доживѐт до его [генетического кода] расшифровки». В 1968 году американцы Роберт Холли, Хар Корана и Маршалл Ниренберг получили Нобелевскую премию за расшифровку генетического кода. Премия была присуждена уже после смерти Георгия Гамова в том же году четырьмя месяцами ранее.
Числа 64 (теоретическая емкость кода) и 20 (фактическая кодирующая емкость, то есть количество кодируемых аминокислот) составляют соотношение правил комбинаторики для размещений и сочетаний с повторами: число А размещений (упорядоченных наборов) с повторами из r (r = 3; размер кодона) элементов множества М, содержащего k (k = 4; число оснований) элементов, равно
Akr = kr= A43 = 64,
а число С сочетаний с повторами из k элементов по r, т. е. любое подмножество из 3 элементов множества, содержащего 4 элемента, равно:
Сkr= [(k+r-1)!] : [r! (k-1)!] = С43= 20.
Это немедленно подводит к мысли о том, что эволюция генетического кода могла начаться с этапа «наборного» кодирования, когда продукт кодировался не последовательностью оснований триплета, а их набором, то есть две такие группы кодонов, как например, САА, АСА, ААС или TGC, TCG, GCT, GTC, CTG, CGT были функционально равнозначны (внутри группы) и направляли синтез одной и той же аминокислоты каждый. Подобные соображения приходят в голову при чтении работ Ишигами и Нагано (1975) – с их идеей о том, что каждая первичная аминокислота могла соответствовать широкому набору кодонов, а также Фолсома (1977) и Трейнора (1984) – с их идеей пермутации оснований в рамках триплета. Очевидно, что меньшее число кодонов не обеспечивало необходимого разнообразия продуктов, а большее было избыточно и, по крайней мере, не соответствовало числу известных сегодня аминокислот. В свое время мы также внесли (очень) скромную лепту в эти идеи, отметив, что число сочетаний из 4 по 3 с повторами иллюстрируется числом квантовых состояний Бозе-газа из трех частиц с четырьмя вероятными собственными квантовыми состояниями54.
Позднее Гамов предложил схему реализации генетического кода, которая предусматривала сборку полипептида непосредственно на молекуле ДНК. По этой модели, каждая аминокислота помещается в ромбической выемке между четырьмя нуклеотидами, по два от каждой из комплементарных цепей. Хотя такой ромб состоит из четырѐх нуклеотидов и, следовательно, число сочетаний равно 256, из-за ограничений, связанных с водородными связями нуклеотидных остатков, возможными оказываются как раз 20 вариантов таких ромбов. Эта схема, получившая название бубнового кода, предполагает корреляцию между последовательными аминокислотными остатками, так как два нуклеотида всегда входят в два соседних ромба (перекрывающийся код). Дальнейшие исследования показали, однако, что эта модель Гамова также не согласуется с опытными данными.
Если бы емкость генетического кода использовалась без остатка, то есть каждому триплету соответствовала бы только одна аминокислота, его защищенность была бы весьма сомнительна: любая нуклеотидная мутация могла оказаться катастрофической. В случае же действующей версии треть случайных точечных мутаций приходится на последние буквы кодонов, половина которых (кодоны октета I) к мутациям не чувствительна вовсе: третья буква кодона может быть любой из четырех – T, C, A или G. Устойчивость к точечным мутациям кодонов октета II в значительной степени определяется двумя факторами – (1) возможностью произвольной замены третьего основания (правда, уже при выборе только из двух – либо пуринов, либо пиримидинов), не меняющей кодируемой аминокислоты вовсе, и (2) возможностью замены пуринов на пиримидины и наоборот, которая сохраняет близкую гидрофильность/гидрофобность продуктов, хотя и не сохраняет их массы. Таким образом, Природа использует чрезвычайно удачный «люфт», называемый вырожденностью кода, когда кодируемому знаку соответствует более, чем один кодирующий.