Числа в генетическом коде. Часть 1.: uri_ben

uri_ben_cephas

Числа в генетическом коде. Часть 1.

Nov 07, 2023 17:29

Предыдущие части:
О порядке, который в генетическом коде
Несколько слов о генетическом коде (Часть Ι)
Несколько слов о генетическом коде (Часть ΙΙ)
Последнее предисловие к рассказу о «Сообщении» Творца в генетическом коде

В последней части « Последнего предисловия» мы рассмотрели одну упорядоченность стандартного генетического кода, которую я назвал одним из элементов «Сообщения» Творца. После этого, я предложил тем читателям, которые, в принципе, понимают, почему описанную закономерность, по крайней мере, хочется подозревать в разумном происхождении, и при этом не хотят это подозрение устранить любой ценой, задаться одним вопросом.

А именно: «а что если это и вправду некое намеренно оставленное в генетическом коде Сообщение, и что если Автор Сообщения хотел, чтобы Сообщение было опознано именно как намеренно оставленное сообщение, - чего тогда следует ожидать, чего тогда следует искать?». Этим вопросом, как мне кажется, действительно полезно задаться перед чтением данного раздела, т.к. есть шанс, что этот раздел окажется, проверкой ответа. Иными словами, быть может, что Вы решите, что ожидать надо чего-то наподобие того, что Вы и увидите в этом разделе.

Ещё одно «предисловие», которого мне хотелось избежать, но которого я избежать не смог.

Для начала напомню, в чём заключается эта «упорядоченность»: в особом характере сумм нуклонных чисел особым образом выбранных наборов молекулярных структур.

Выбранные наборы определяются посредством двух делений на две части: во-первых, деления всех обобщённых кодонов на те, которые принадлежат к «простым» семействам кодонов и те, которые принадлежат к «сложным» семействам, и, во-вторых, деления структур аминокислот на остовы и боковые цепи, что даёт 4 (2×2 - «произведение» двух делений) набора молекулярных структур, а именно: {Прост., Слож.}×{Ост., Б.ц.} = {Прост.-Ост., Прост.-Б.ц., Слож.-Ост., Слож.-Б.ц.}. См. Рисунок 1 ниже.

Рис. 1. Четыре набора молекулярных структур порождаются "произведением" двух делений - деления кода (в обобщённом представлении) на "простые" и "сложные" семейства кодонов и деления аминокислотных остатков на остов и боковую цепь.

И оказывается, что 4 суммы нуклонных чисел (6 сумм, считая с суммами для целых аминокислот) этих наборов структур составляют очевидное арифметико-эстетическое целое (см. Рисунок 2 ниже).

Рис. 2 Получившийся набор чисел образует весьма примечательную систему. Это - один из элементов «Сообщения». В некотором смысле, эталонный.

Как видите, всё просто, но... но что если это случайность? И, напротив, что если это не случайность?

Тут надо повторить некоторые слова из предыдущей части: если это не случайность, то это довольно-таки непростая неслучайность, так как в природе нет, как физического объекта, не только «набора аминокислот, кодируемого обобщёнными кодонами сложных семейств кодонов», но и вообще, в природе нет генетического кода как физического объекта. Это абстракция, появляющаяся как что-то доступное сознанию, только после открытия и соответствующего изучения генетического кодирования (конечно, физическая реальность в которой люди увидели «генетический код» существует, я лишь хочу подчеркнуть, что в живых существах это никак не табличка, которую можно увидеть или пощупать хоть руками, хоть каким-то изощренным прибором). Также, в природе отдельно не существуют ни остовы ни боковые цепи - это части молекулярных структур, выделяемые только посредством мысленного сравнения. Да и сами структуры нарочито, вызывающе абстрактны - это структуры целых аминокислот (т.е., не остатков в составе белковой цепочки), в вакууме (т.е., в незаряженной форме, в отличие от состояния, обычного для природных условий внутри организма), да ещё и с пролином, «исправленным» так, что бы нуклонное число его остова не выбивалось из остального ряда. Фактически, перед нами величины (соответствующие нуклонные суммы), которые в живой природе (без участия человека) никак не могут быть «вычислены» сразу по нескольким непреодолимым причинам. И в то же самое время, для человека, смотрящего на генетический код, как на абстрактную систему, «добраться» до этих величин, рискну предположить, - лишь вопрос времени (и откуда-то появившегося желания искать структуру там, где её быть не должно).

И вот, мы считаем нуклоны «бросающихся в глаза» частей структур «бросающихся в глаза» наборов аминокислот, выбранных из таблицы кода и видим что видим - простые арифметические соотношения (1=1 и 3²+4²=5²) и красоту десятичной записи (однородность 1110 и 333, связь через циклическую перестановку 592 и 925) в получившемся наборе чисел. Как видите, видим мы тоже нечто «бросающееся в глаза». Думаю, понятно, что искать какой-либо биологический смысл «простых арифметических соотношений» или «красивости записи в десятичной системе счисления» нуклонных сумм, несуществующих как физических объектов, наборов молекулярных структур было бы ... чем-то чрезмерным.

При этом, эти числа и их соотношения и свойства, конечно, не неизбежны: достаточно поменять значение какого-нибудь кодона, и все числа, в порождении которых этот кодон задействован, изменятся, а вся их красота пропадёт, что легко можно проверить самостоятельно, взяв и рассмотрев известные на данный момент природные варианты генетического кода, отличающиеся от стандартного.

В чём же причина такого распределения аминокислот по кодонам, если не в разуме, или, если Вы хотите более «объективной» формулировки: не в «особых арифметико-эстетических» требованиях, наложенных на нуклонные суммы «бросающихся в глаза» частей структур «бросающихся в глаза» наборов аминокислот, выбранных из таблицы кода - требованиях арифметической простоты и красоты, наложенных независимо от всех функциональных требований?

Если причина не в самом особом характере нуклонных сумм особо выделяющихся наборов структур, то остаётся только ссылка на случайность, но в начале я как раз предложил читателю предположить неслучайность и попробовать ответить на вопрос: «а что если это и вправду некое намеренно оставленное в генетическом коде Сообщение, и что если Автор Сообщения хотел, чтобы Сообщение было опознано именно как намеренно оставленное сообщение, - чего тогда следует ожидать, чего тогда следует искать?». Подсказка: думаю, что ответ из которого следуют вполне конкретные ожидания относительно реально существующего генетического кода должен исходить из размышлений о том, была ли убедительность в числе целей Автора.

Мы вернулись к тому с чего начинали. Я сделал круг, чтобы дать ещё немного подумать читателю, куда можно пойти дальше, так сказать, посмотрев по сторонам, а теперь и сам немного «посмотрю по сторонам» на глазах у читателей перед тем как пойти дальше.

Итак, мы взяли 4 «самые заметные» «кучки нуклонов» из «обобщённой» таблички генетического кода и увидели в них неожиданную арифметическую упорядоченность. Можно сравнить эту ситуацию с ситуацией в « задаче про белочку», в которой я попробовал сделать «игрушечную модель» упорядоченности того же рода. В этой задаче, разумеется, порядок заметнее, чем то, что мы пока успели увидеть в генетическом коде: кучки орешков выделяются сразу же и притом безальтернативно. В свою очередь, выделенные в генетическом коде «кучки» нуклонов, хоть и весьма примечательные, требуют определённого размышления и исследования таблицы кода и молекулярных структур, чтобы их найти. И они не так безальтернативны: как Вы помните, в «третьей упорядоченности», о которой говорилось в « Последнем предисловии» генетический код рассматривался как одна большая «кучка», а молекулярные структуры рассматривались, как две «кучки», но другим образом. Найденный порядок в суммах элементов «кучек», в случае нуклонных «кучек», рассмотренных нами, так же, более замысловат, чем в случае кучек орешков из задачки про белочку - он включает в себя равенство, квадраты пифагоровой троки и красоту записи чисел в десятичной позиционной системе. В отличие от простого: «начало натурального ряда», как в случае с орешками.

Достаточно, чтобы кто-нибудь скептически настроенный начал говорить, что мол, есть бесконечное число позиционных систем счисления (впрочем, интересных с точки зрения «записи» и «чтения» сообщения такого рода вряд ли много больше пары десятков, что определяется диапазоном допустимых чисел). Или, что есть немало «интересных» соотношений кроме равенства или квадратов чисел пифагоровых троек. Или, наконец, что есть много способов выбрать группу кодонов из генетического кода так, чтобы нуклонные суммы их продуктов оказались красивыми в том или ином смысле. Апофения! «Всё в порядке, пришельца не было».

Стоп. Конечно, выбрать группу кодонов из генетического кода можно множеством способов, и даже если выбирать обобщённые кодоны сразу целыми «семействами» будет 2¹⁶−1=65535 способов сформировать набор, и примерно на каждую тысячу (задачка для любителей посчитать) наборов будет приходиться один «сбалансированный» - такой, в котором число нуклонов в остовах будет такое же как в боковых цепях. И даже более того, так как все «сбалансированные» наборы должны иметь нуклонные суммы кратные 74м (если рассматривать пролин численно поделенным так же как и все аминокислоты), то каждый третий из сбалансированных наборов будет иметь нуклонную сумму кратную 222. Да, есть откуда выбирать - в нашем реальном стандартном генетическом коде (обобщённом) есть 29 наборов таких семейств (сбалансированных и с нуклонными массами кратными 222)! Но мы-то увидели сбалансированный набор, не перебирая семейства кодонов произвольным образом, а посмотрев только один из двух самых примечательных способов выбора - рассмотрев обобщённые кодоны «сложных» семейств ( и получив суммы: 1110=1110). А когда мы рассмотрели второй самый примечательный набор обобщённых кодонов - кодоны «простых» семейств, мы увидели суммы из того же самого набора красивых чисел (см. Рисунок 3). Какова вероятность увидеть числа, которые дополняют ту упорядоченность, которую мы уже видели, увидеть числа из набора, если этот набор уже задан? Притом, конечно, не всякие числа из этого набора одинаково «хороши»: появление двух «циклически связанных» чисел невозможно без наличия числа-слагаемого равного 333. Интуитивно кажется, что весь набор хотя и не астрономически маловероятен, но всё же маловероятен (не в конкретном виде, а именно как «что-то такое», в самом общем виде).

Рис. 3 "Красивые" нуклонные суммы, которые мы видели объединены не только тем, что их записи в десятичной системе счисления красивы, но и тем, что все они являются кратными 37и. Это, одновременно, и условие "красивости" их записи в десятичной позиционной системе счисления.

Но точную вероятность найти «что-то такое» определить непросто. Что же делать? Можно, конечно сказать, что ничего точно сказать нельзя или склониться к тому отношению к найденной упорядоченности, которое более по душе. Можно всё-таки попробовать каким-то образом уточнить характер найденной упорядоченности, чтобы стало возможно автоматически перебрать все мыслимые таблицы генетического кода и сказать, что «что-то такое» (в некотором уточнённом смысле) обнаруживается с такой-то вероятностью. Это трудная задача.

Но ещё можно вспомнить в третий раз предложенный в начале этой части опрос: «а что если это и вправду некое намеренно оставленное в генетическом коде Сообщение, и что если Автор Сообщения хотел, чтобы Сообщение было опознано именно как намеренно оставленное сообщение, - чего тогда следует ожидать, чего тогда следует искать?». Думаю, что ответ из которого следуют вполне конкретные ожидания относительно реально существующего генетического кода должен включать в себя понимание, что если убедительность была в числе целей Автора (а ожидать иного довольно бессмысленно), то Сообщение должно быть таким, что увидеть нечто подобное ему в «случайном» генетическом коде было настолько маловероятным, насколько это возможно. Но, как мы видели выше, то что мы видели хотя и сильно привлекает к себе внимание, но не обладает предельно малой вероятностью.

Думаю, на данный момент должно стать очевидно, что единственным разумным ожиданием, при верности предположения о том, что мы увидели намеренное сообщение, и при ожидании, в этом случае, большей убедительности, может быть только ожидание наличия в генетическом коде других частей сообщения. При этом, ожидать следует, что другие части составляют с уже найденной единое целое. Т.е., следует рассмотреть все «бросающиеся в глаза» наборы кодонов, и следует ожидать, что нуклонные массы их остовов и боковых цепей будут образовывать некие простые арифметические соотношения или иметь красивую .десятичную запись (лучше всего, например, быть кратными 111) значительно чаще, чем ожидается.

Числа в «обобщённой» таблице генетического кода.

Продолжим рассмотрение таблицы кода в обобщённом виде. Понятно, что в ней потенциально возможно найти и другие упорядоченности подобные уже найденной: с точки зрения поиска существуют и другие деления семейств кодонов, которые имеет смысл рассмотреть (это мы сейчас сделаем). Стоит заметить, что и с точки зрения создания упорядоченности, найденное нами деление кода так же позволяет сделать выбор из очень большого количества потенциальных кодов (например, если мы перемешаем семейства кодонов внутри каждой из двух частей - «простой» и «сложной», то найденная упорядоченность сохранится, но возможно появление ещё какой-нибудь новой упорядоченности).

Рис. 4. Деление обобщённой таблицы кода на два набора семейств кодонов, которое мы уже рассмотрели.

Итак, какие ещё деления кода по семействам кодонов имеет смысл рассмотреть? Понятно, что как я писал ранее, существует всего 16 семейств и, соответственно, 2¹⁶−1, т.е. 65535 способов выделить некоторый набор этих семейств, среди которых будет немало «красивых» в десятичной системе счисления (или не в десятичной) и даже «сбалансированных», но с точки зрения проверки предположения о том, что мы видим в действительности сообщение, различные наборы семейств неравноправны. Так, набор семейств TT, CC, AA, GG более «бросается в глаза», чем набор TA, CC, AC, GA, GC - первое деление можно определить «просто», как набор всех семейств кодонов с одинаковыми 1м и 2м нуклеотидами, а для второго деления «простого» определения, по-видимому, нет. Точно так же деление всех семейств кодонов на две равные части по химическому типу (пурин или пиримидин) первого нуклеотида проще какого-нибудь «случайного» выбора 8и семейств.

Таким образом, ясно, что хотя самое «бросающееся в глаза» деление кода, основанное на том, как в нём организованы повторяющиеся значения кодонов, мы уже рассмотрели, существуют и другие «бросающееся в глаза» деления, основывающиеся на самих семействах кодонов, как двухбуквенных строк из букв {T,C,A,G}. Думаю, должно быть понятно, что достойных рассмотрения способов поделить код весьма немного. Вы можете самостоятельно попробовать поискать в этом направлении, а я расскажу, что было найдено теми, кто уже поискал.

Итак, упорядоченности были найдены при некоторых из делений всех семейств кодонов на две равные части по значению как первого так и второго нуклеотида. Так как есть всего 3 способа поделить 4 нуклеотида на две части по 2 нуклеотида, то делений семейств пополам по значению каждого из двух нуклеотидов, определяющих семейство, будет ровно 6. Посмотрим на эти деления на иллюстрации ниже.

Рис. 5. 6 возможных делений семейств кодонов на две равные части. 3 деления также разделяют на равные части наборы "простых" и "сложных" семейств.

Не знаю, надо ли доказывать, что среди всех делений семейств кодонов на две равные части, эти 6 делений - самые «простые». Но мне трудно представить, что кто-то, перебирая «простые» на свой взгляд деления, обошёл бы их стороной, поэтому интуитивного представления о «простоте» мне в данном случае кажется вполне достаточно :)

Так вот, в трёх из этих делений обнаруживается искомое. И, по некоторому стечению обстоятельств, искомое обнаруживается в тех 3х делениях, которые распределяют «простые» и «сложные» семейства поровну между половинками (эти деления подсвечены на рисунке жёлтым фоном и красной рамкой). Рассмотрим их по очереди.

Начнём с деления по первому нуклеотиду на две группы: одну, в которой 1й нуклеотид - пиримидиновый (T или C) и другую, в которой он - пуриновый (A или G). См. рисунок ниже.

Рис. 6 Деление обобщённого кода по типу первого нуклеотида кодона даёт один сбалансированный набор семейств и нуклонные суммы боковых цепей наборов кратные 37

В этом делении одна из половин оказывается «сбалансированной», также оказывается (как следствие), что обе половины имеют нуклонные суммы кратные 37и, т.е. из того же набора, которому принадлежат уже рассмотренные нами нуклонные суммы. Но, очевидно, что эти два числа не образуют ничего «красивого». «Красива» нуклонная сумма остовов половинки «1й:A,G» (888), но поскольку, как мы помним, все остовы имеют нуклонное число 74, то каждая третья нуклонная сумма остовов кратна 222. Так что это обычная для наборов остовов «красота».

Тем не менее, если немного пристальнее присмотреться как к нуклонным числам, так и к самим двум получившимся наборам семейств, можно заметить кое-что «красивое» и в суммах боковых цепей. «Присматриваться» можно по-разному, например, можно заметить, что одно семейство - ТТ, само по себе сбалансировано - нуклонные числа боковых цепей аминокислот F и L (фенилаланина и лейцина) в сумме дают 148 (91+57), как и их остовы (2×74=148). А это - циклическая перестановка 814 (в десятичной позиционной записи). Или можно заметить, что 629 = 148 + 481, и после этого начать просматривать нуклонные суммы внутренних делений внутри отдельных половинок деления.

Полный перебор всех внутренних выборок в каждой из половин даёт следующее:

в половинке «1й:T,C» есть два набора семейств с нуклонными суммами 148, и притом сбалансированных: {TT} и {TA, CC}. Кроме порождаемых (объединением и дополнением множеств) этими двумя наборами, других наборов с суммами кратными 37 в этой половинке нет.
в половинке «1й:A,G» есть два набора семейств с нуклонными суммами боковых цепей равными 148 (несбалансированных): {GC, GA, GG} и {GC, GG, AT}. Кроме порождаемых этими двумя наборами, других наборов с суммами кратными 37 в этой половинке нет.

Иными словами, смотрите как получается: из каждой половинки можно выбрать 254 набора, а точнее, так как каждый набор порождает и дополнение до полной половинки - 126 независимых набора - в сбалансированной половинке с суммой 814 обнаруживается два независимых способа выбрать сбалансированный набор с суммой 148, а в половинке с суммой 629 равной 148 + 481, обнаруживается два способа выбрать 148 (и, как дополнение, 481). И других независимых наборов с суммами кратными 37 ни в одной из половинок нет.

Что интересно, один из наборов из одной половинки и один из наборов из другой половинки дополняют друг друга: {TT} дополняет {GC, GA, GG} в том смысле, что вместе эти два набора имеют равное количество простых и сложных семейств и дополнительны по второму нуклеотиду - см. Рисунок 7 ниже.

Рис. 7

На рисунке ниже я изобразил систему «красивых» чисел, появляющихся в рассмотренном делении взяв ту пару способов выбрать 148, которые дополняют друг друга. Я также указал значения некоторых сумм остовов и полных аминокислот, хотя, как я писал не один раз, суммы остовов всегда кратны 74м и «красота» в них обычна, тем не менее, раз уж они «играют» в общем ансамбле, пусть и они будут указаны, хотя на них стоит обращать значительно меньше внимания.

Рис. 8 Ещё один элемент Сообщения (w обозначает нуклонные суммы целых аминокислот).

А теперь посмотрим на два других деления семейств по типу 1о или 2о нуклеотида кодона: «1й:T,G» vs «1й:C,A» и «2й:T,G» vs «2й:C,A». См. рисунок ниже.

Рис. 9 На этот раз мы видим "перекрёстные" равенства сумм нуклонов.

Как видите, нуклонные суммы получившихся частей кода весьма примечательны - их записи в десятичной системе счисления выглядят как арифметические прогрессии. Надо отметить, что такое деление на два «разнонаправленных» числа-прогрессии возможно именно для кратных репьюнита: 654 +789 = (7+6)×100+(8+5)×10+(9+4)×1=13×111 (хотя сумма боковых цепей всего обобщённого кода явно не упоминалась, как помните она состоит из двух частей 333+1110).

Как и в предыдущем случаю, это деление кода также стоит рассмотреть внимательнее, чтобы увидеть ещё кое-что. А именно, можно заметить, что наборы семейств кодонов, участвующие в обоих равенствах имеют общие части, общие слагаемые - если эти общие слагаемые сократить, окажется, что оба равенства влекут за собой третье (само наличие равенств, но не их значения, следуют из него). См. рисунок ниже.

Рис. 10 Оба равенства влекут за собой третье.

Что ж, не правда ли интересно, чему равна сумма частей третьего равенства? Она равна 369. Как видите третья сумма обладает той же отличительной чертой, что и первые две - её десятичная запись тоже имеет вид арифметической прогрессии.

На данный момент мы рассмотрели почти все числовые элементы Сообщения, которые можно из таблицы кода в обобщённом виде, но есть и другие числовые элементы Сообщения, о которых мы поговорим в следующей части рассказа: Числа в генетическом коде. Часть 2.

Ниже - графическое резюме этой части.

Рис. 11. Графическое резюме.

Созерцая эту схему можно задастся вопросом, является ли увиденное подтверждением предположения, сделанного в начале.

вера, наука, естественная апологетика, Сообщение в генетическом коде