Несколько слов о генетическом коде (Часть ΙΙ): uri_ben

uri_ben_cephas

Несколько слов о генетическом коде (Часть ΙΙ)

Sep 22, 2023 17:22

(начало - здесь)

ДНК

Итак, типичная молекула ДНК представляет собой длинную цепочку из большого числа звеньев - её строительных блоков. Эти строительные блоки называются нуклеотидами, а всего их 4 разных типа. В отличие от белков, 20 типов звеньев которых позволяют реализовывать поразительно широкий диапазон функций, 4 типа звеньев ДНК хорошо подходят для одной вещи - хранить и передавать информацию. Интересно, что это стало понятно сразу же, как только была открыта пространственная структура молекулы ДНК, знаменитая «двойная спираль», модель которой была впервые опубликована Джеймсом Уотсоном и Фрэнсисом Криком в 1953 году.

Надо пояснить, что такое «двойная спираль», и чем она так примечательна. Дело в том, что ДНК в живых организмах существует не в виде отдельных цепочек, а в сдвоенных цепочек - в виде пар т.н. «комплементарных» цепочек. Каждая молекула ДНК - отдельная цепочка из нуклеотидов связана с идущей вдоль неё, но в обратном направлении «комплементарной» цепочкой. «Спиралью» эта пара молекул называется, т.к. молекулы немного закручены друг относительно друга. Это название не совсем корректно, правильнее было бы назвать такую структуру винтом (она напоминает шнек мясорубки или макаронные изделия типа «спиралек», только очень-очень длинные).

Но самое главное, что хотя в отдельной цепочке ДНК нуклеотиды могут идти в любом порядке, нуклеотиды двух «комплементарных» цепей в двойной спирали расположены друг напротив друга «комплементарными» парами, и всякий нуклеотид однозначно определяется своей «комплементарной» парой. Чтобы понять это лучше, посмотрим на абстрактное представление некой одиночной цепочки ДНК на рисунке ниже.

Рис 7. Пример одиночной цепочки ДНК в самом общем представлении.

На рисунке показано направление цепочки и 9 её нуклеотидов. Всего в цепочке 4 разных типа нуклеотидов, обозначенных буквами A, T, G и C (они изображены символами различного цвета и формы для наглядности и удобства, которое станет понятно далее).

Исходя из написанного ранее, ясно, что зная последовательность нуклеотидов этой молекулы ДНК, можно однозначно дорисовать рядом вторую, «комплементарную» молекулу, если, конечно, знать, какой нуклеотид является правильной парой к каждому из нуклеотидов первой молекулы.

Комплементарные пары следующие: A-T и C-G. Т.е. напротив Α в двойной спирали всегда стоит Τ (и наоборот), а напротив C - G (и наоборот). Зная это, Вы без труда сможете написать последовательность комплементарной (к изображённой на Рис. 7) молекулы ДНК (конечно, учитывая противоположную направленность молекул). На следующем рисунке изображена соответствующая двойная цепочка ДНК.

Рис. 8 Двойная цепочка ДНК (без демонстрации "спиральности")

Открыв эти свойства структуры молекулы ДНК, т.е. произвольность состава отдельной цепочки и комплементарность, полностью обуславливающую последовательность нуклеотидов одной из комплементарных цепочек последовательностью другой, авторы открытия сразу поняли, что обнаружили молекулярный базис наследственности. Почему? Потому что, если одна одна цепочка нуклеотидов точно кодирует (здесь даже в более простом смысле, чем «код Морзе») другую, то каков бы ни был механизм синтеза новых цепочек, получается, что он копирует точную последовательность нуклеотидов, которая при этом «физически» может быть любой, «произвольно выбранной». Кроме того, поскольку обе цепочки в двойной спирали равноправны, сразу становится виден механизм неограниченного удвоения ДНК.

Итак, сказанного выше оказалось достаточно для одного из авторов открытия, Фрэнсиса Крика, чтобы в письме своему 12-летнему сыну он написал следующее:

«Теперь мы полагаем, что ДНК есть код. Т.е., порядок звеньев (букв) отличает один ген от другого гена (как одна страница текста отличается от другой). Теперь ты можешь понять, как Природа делает копии генов».

Он также нарисовал схему, которую я сымитирую на следующем рисунке.

Рис. 9 Умозрительный "механизм" копирования ДНК, следующий из её структурных свойств.

Итак, на данный момент я рассказал о самой общей «абстрактной» структуре ДНК, как двух связанных друг с другом разнонаправленных комплементарных линейных цепочках из 4х типов звеньев (в этой фразе следует хорошо уяснить себе каждое слово), структура которых позволяет хранить и копировать произвольную последовательность звеньев, т.е. позволяет ДНК быть носителем «генетической информации». Из сказанного ранее мы также знаем, что последовательность из 4х нуклеотидов ДНК каким-то образом кодирует последовательность из 20и звеньев белков, и то, что формально «генетический код» - это алгоритм, позволяющий, при знании кодирующей последовательности, получить кодируемую. Также я писал, что белок кодирует не ДНК непосредственно, а её временная «копия» - РНК, о которой я ещё ничего не сказал. Но перед тем как переходить к РНК и кодированию белков, я хотел бы сказать ещё немного и о фактической химической структуре ДНК и её звеньев - нуклеотидов. Вам не нужны будут глубокие знания, но усвоить кое-что было бы всё же очень неплохо.

Как я писал, чтобы говорить о генетическом коде формально, достаточно было бы сказать о ДНК как о «строках» из 4х типов символов, о белках как о «строках» из 20и типов символов и алгоритме (вроде таблички кода Морзе), позволяющему получать последние из первых, но для понимания того, о чём вообще идёт речь, к сожалению (а может быть, к счастью), нужно несколько большее. В частности, всё сказанное выше про ДНК, фактически, необходимо для понимания того, что такое «комплементарные» нуклеотиды. И это понимание пригодится, когда в рассказе о «Сообщении» появится соответствующая фраза. Кроме «комплементарности» в рассказе о «Сообщении» будет встречаться и другое свойство нуклеотидов - тип входящих в их состав азотистых оснований, про который я хочу рассказать при помощи структурной формулы небольшого кусочка ДНК на рисунке ниже.

Рис. 10 Структурная формула фрагмента ДНК, содержащая по одному разу нуклеотид каждого типа в обеих комплементарных цепочках.

Посмотрим внимательно на структурную формулу. Структура мысленно разбивается на ряд блоков, некоторые из которых повторяются в каждом звене-нуклеотиде (хотя, может быть, сходу и не очень понятно, что такое нуклеотид в смысле молекулярной структуры), а некоторые меняются от нуклеотида к нуклеотиду. Как и в случае белков, в звеньях ДНК есть константные части - «остов», две части которого подсвечены бледными цветами - бледно-красным и бледно-зелёным. Есть и вариабельные части - как раз таки «азотистые основания», циклические структуры, подкрашенные на этом рисунке насыщенными цветами - красным, оранжевым, синим и фиолетовым, так же, как символы соответствующих нуклеотидов на абстрактной схеме (после внимательного рассмотрения структуры Вы сможете отметить, что символы для абстрактной структуры ДНК намекают своей формой на некоторые особенности её молекулярной структуры).

Посмотрим подробнее на выделенные блоки. Бледно-зелёным выделены остатки дезоксирибозы - пятичленного сахара. Отсюда «дезоксирибо-» в названии ДНК («дезоксирибонуклеиновой кислоты»). Бледно-красным выделены фосфаты - группы с кислотными свойствами, которые и делают ДНК «кислотой», хотя в живой клетке она находится в виде «соли». Дезоксирибоза и фосфаты составляют остов двойной спирали ДНК, который пространственно «торчит» наружу спирали. Как видно на схеме, фосфаты и остатки рибозы следуют в цепочке ДНК чередуюсь друг за другом, причём, фосфаты присоединяются с двух разных концов рибозы - к разным её атомам. По номерам атомов углерода в остатке рибозы названы два конца цепочки ДНК, 5'-конец и 3'-конец (читается «пять-штрих» и «три-штрих»). В рамках нашего рассказа точное представление о структуре ДНК не слишком важно, но надо понимать, что у нити ДНК (как и у нити РНК, структура которой практически такая же как у ДНК), есть два различимых конца, и при синтезе РНК по ДНК и белка по РНК направление имеет значение (так же как при кодировании текста азбукой Морзе имеет значение, где начало, а где - конец строки). Ниже на рисунке изображено одно звено цепи ДНК - нуклеотид, содержащий аденин в качестве азотистого основания - «дезокси-аденозин-монофосфат», а точнее его «остаток» (названия типа «дезокси-аденозин-монофосфат» употребляться далее не будут, вместо полного названия нуклеотида будет говориться просто «аденин» или «пурин», если важен будет только химический тип основания). Атомы углерода дезоксирибозы пронумерованы общепринятым образом.

Рис. 11 Остаток нуклеотида внутри цепочки ДНК.

Внутрь спирали торчат азотистые основания, которые обеспечивают парное взаимодействие комплементарных нуклеотидов. На Рисунке 9 пунктирными линиями обозначены т.н. водородные связи, которые физически обеспечивают связывание комплементарных пар нуклеотидов друг с другом. Из структурной формулы сразу становится видно, почему нуклеотид A «стыкуется» с нуклеотидом T, а G «стыкуется» с C. Это обеспечивается как расположением функциональных групп на азотистом основании, так и размером азотистого основания (в двойной спирали, в которой физический размер каждой пары должен одинаковым, так что «большое» азотистое основание может находится в комплементарной паре только с «маленьким»). Полезно внимательно рассмотреть схему и понять это.

Итак, из молекулярной структуры видно, что два из азотистых оснований, входящих в состав нуклеотидов - «большие», они имеют вид двойного цикла, а два - «маленькие», они имеют вид одиночного цикла.

«Большие» азотистые основания являются производными пурина, это «пуриновые» азотистые основания, они называются «аденин», который кратко обозначается буквой A и «гуанин», который обозначается буквой G.

Рис. 12 Аденин и гуанин

«Маленькие» азотистые основания являются производными пиримидина, это «пиримидиновые» азотистые основания, они называются «цитозин», который кратко обозначается буквой C и «тимин», который обозначается буквой T.

Рис. 13 Тимин и цитозин

На данный момент я рассказал о ДНК всё, что нужно, на мой взгляд для понимания последующего рассказа. Мне бы хотелось, чтобы в памяти осталось следующее: цепочка ДНК состоит из звеньев 4х типов - «нуклеотидов». В природе ДНК существует в виде двух цепочек, идущих параллельно, друг навстречу другу, связанных водородными связями парных «комплементарных» азотистых оснований - составных частей нуклеотидов. Как бы, как застёжка-молния.

Каждое основание (и, соответственно, каждый нуклеотид) может быть «состыковано» только с одним конкретных «комплементарных» ему основанием. Или, другими словами, 4 типа оснований в ДНК, разбиты на 2е комплементарные пары, так что в двух комплементарных нитях друг напротив друга может быть только пара нуклеотидов с комплементарными основаниями.

Кроме того, 4 типа оснований в ДНК делятся на два типа по типу основания - пуриновому или пиримидиновому. Два, описанные в этом разделе, естественных деления множества из 4х азотистых оснований (и, соответственно, нуклеотидов) на две половины будет встречаться в рассказе о «Сообщении».

Рис. 14 Четыре азотистых основания, определяющих свойства нуклеотидов естественным образом делятся на две пары двумя способами - по комплементарности и по типу основания - пуриновому или пиримидиновому.

Завершу раздел про ДНК моделью её пространственной структуры, из которой понятно, почему двойная цепочка ДНК называется двойной спиралью (пояснение: оранжево-красные группы атомов - фосфаты, с оранжевым атомом фосфора и красными атомами кислорода; синие азоты входят в состав азотистых оснований - видно, что плоские азотистые основания перпендикулярны оси спирали).

Рис. 15 Пространственна структура "двойной спирали" ДНК

РНК и генетический код.

Как я уже писал ранее, в контексте нашего рассказа, о РНК можно думать, как о временной (возможно, «отредактированной» тем или иным образом) копии участка ДНК, нужного для синтеза белка. В живых организмах из этой копии могут вырезаться участки, не предназначенные для синтеза белка, причём это могут быть разные участки, в зависимости от условий, в ней даже могут массово заменятся отдельные звенья - нуклеотиды. Это зависит от конкретного организма: одно дело - кишечная палочка, и другое - лошадь, - но для нашего рассказа это несущественно.

Для простоты, достаточной для рассказа о «Сообщении», я фактически оставлю РНК за скобками (что биологически, конечно же, сильное упрощение), и при описании генетического кода, т.е. алгоритма, который позволяет, при знании кодирующей нуклеотидной последовательности, получить кодируемую аминокислотную последовательность белка, я даже буду говорить о кодирующей последовательности звеньев ДНК, а не РНК, игнорируя то, что в реальности часть последовательности ДНК может не войти в свою копию-РНК или войти с изменениями, влияющими на результат - кодируемый белок. С точки зрения фактической структуры генетического кода, как алгоритма перевода из кодирующей последовательности в кодируемую, никакой разницы не будет. Но чтобы оставить РНК за скобками, так, чтобы у читателя не осталось ощущения сокрытия чего-то важного, надо все же сказать о ней пару слов.

Итак, об РНК можно думать как о рабочей копии ДНК, синтезируемой при необходимости (с одного участка ДНК может быть сделано много РНК-копий, с другого - мало). Об РНК можно думать как о данных в оперативной памяти, в отличии от данных на накопителе или на сервере. РНК, также как и ДНК, представляет собой цепочку из нуклеотидов 4х разных типов и структурно очень похожа на последнюю. Отличия РНК от ДНК следующие:

Во-первых, как отражено в самом названии, Рибо-Нуклеиновая Кислота содержит остатки рибозы, в отличие от дезоксирибозы в составе Дезоксирибо-Нуклеиновой Кислоты. Дезоксирибоза отличается от рибозы тем, что у рибозы есть гидроксогруппа при атоме углерода 2', а у дезоксирибозы её нет. См. рисунок ниже.

Рис. 16 Сравнение остатков дезоксирибонуклеотида и рибонуклеотида. Отличие заключается в одной функциональной группе.

Это отличие, т.е. наличие гидроксильной группы, которой нет у ДНК даёт РНК возможность осуществлять функции, недоступные для ДНК, но, по-видимому, значительно ухудшает способность РНК служить носителем генетической информации. Так, гидроксогруппа при 2'-углероде не даёт возможности РНК существовать в виде такой же двойной спирали как ДНК (хотя для неё возможен другой тип двойной спирали), а её реакционная способность при достаточной длине цепочки может проявляться в спонтанном гидролизе себя самой (разрыве связей с участием молекул воды). Впрочем, я не возьмусь дать детальный анализ различий свойств РНК и ДНК, тем более, что это выходит за рамки того, что нужно знать, для понимания рассказа о «Сообщении». Главное, что в природе РНК обычно встречается в виде относительно коротких, одиночных (в смысле, не двойных) цепочек. Это - второе различие.
Третье различие состоит в том, что в цепочках РНК используется набор азотистых оснований, немного отличающийся от набора в ДНК. Вместо тимина в РНК используется урацил, который отличается от тимина отсутствием метильной группы (см. рисунок ниже). В остальном, урацил идентичен тимину - он как и тимин образует комплементарную пару с аденином, так, что для нас это просто аналог тимина в РНК.

Рис. 17 Сравнение остатков тимина и урацила.

Итак, из трёх названных отличий, для нас совершенно не важно отличие в типе остатка пятичленного сахара, т.е., наличие в структуре рибозы вместо дезоксирибозы в ДНК. Для нас РНК - это просто копия одной из цепей двунитевой ДНК, за исключением того, что вместо тимина, обозначаемого буквой T в цепочке РНК стоит урацил, обозначаемый буквой U. Копирование осуществляется за счёт комплементарного взаимодействия азотистых оснований синтезируемой цепочки РНК и цепочки ДНК, которая служит для РНК как бы шаблоном или, как принято говорить, матрицей (термин из взят книгопечатания), эта цепочка-шаблон называется матричной. Последовательность, полученная в результате такого синтеза РНК будет идентична (исключая замену тимина ДНК на урацил РНК) последовательности другой цепочки ДНК, комплементарной матричной цепочке. Эта цепочка ДНК называется кодирующей. Этот процесс, как я писал в начале, называется транскрипцией. Схематично это изображено на следующем рисунке.

Рис. 18 Схематичное изображение "транскрипции". Каждому нуклеотиду "кодирующей" цепочки ДНК (красная стрелка) соответствует нуклеотид кодируемой РНК (зеленая стрелка), комплементарный соответствующему нуклеотиду "матричной" цепочки ДНК (синяя стрелка). Прочитайте это внимательно, тут стоит хорошо понимать каждое слово.

Как видно из схемы, двойная цепочка ДНК «расплетается», и на месте одной из цепочек синтезируется нить РНК, комплементарная второй цепочке и идентичная (с точностью до замены тимина на урацил) первой цепочке. То, как именно определяется какая из двух цепочек двуцепочечной ДНК будет скопирована как РНК, и то, как определяется, где начнётся и где закончится копирование, выходит за рамки данного рассказа, но надо понимать, что всё это происходит контролируемо, а не случайно, - «молекулярная машинерия» транскрипции «определяет» что именно надо копировать на основании последовательности нуклеотидов ДНК и других условий.

На данный момент мы узнали об РНК и транскрипции всё нужное для понимания дальнейшего рассказа, и самое главное, мы узнали, что РНК и транскрипцию, если смотреть с «высоты птичьего полёта», можно считать просто копией и копированием. Теперь, наконец-то, можно перейти к собственно генетическому кодированию. Начнём с примера. На предыдущем рисунке изображена последовательность РНК. Она такова, что может считаться кодирующей некоторой белок (говоря языком компьютерной аналогии, последовательность РНК, кодирующая белок, должна иметь определённый «формат»). Посмотрим на следующем рисунке на то, что же она кодирует.

Рис. 19 Схематичное изображение "транскрипции" и "трансляции".

Итак, на рисунке кодирующая РНК (зелёная полоска) состоит из 9и нуклеотидов, а кодируемый белок (темно-синяя узкая полоска снизу) из 2х аминокислот. Кодирующие тройки нуклеотидов соединены с кодируемыми аминокислотами: тройка нуклеотидов AUG кодирует M (метионин), тройка CAG кодирует P (пролин). Кроме того, две тройки нуклеотидов соединены на рисунке с символами ⏵ («старт») и ⏹ («стоп») , которые означают, что соответствующие тройки кодируют начало и окончание синтеза белка: тройка AUG, кроме того, что кодирует метионин (M), также «кодирует» начало синтеза белковой цепочки, а тройка UGA «кодирует» окончание синтеза (эта тройка не кодирует никакой аминокислоты). Что мы видим в этом «игрушечном примере» синтеза белка из двух аминокислотных остатков (в реальности типичный белок состоит из двух-трёх сотен остатков)? Мы видим, что сигнал начала синтеза совпадает с сигналом синтеза метионина, сигнал конца синтеза не кодирует никакой аминокислоты и обе аминокислоты, как и сигналы начала и конца синтеза, кодируются тоже тройками нуклеотидов. Это верно и для всех остальных аминокислот и синтактических сигналов (сигналов начала и конца синтеза). Все аминокислоты и все синтактические сигналы кодируются тройками нуклеотидов, идущими одна за другой, без вставок и пропусков.

Все аминокислоты и все синтактические сигналы кодируются тройками нуклеотидов, идущими одна за другой, без вставок и пропусков.

Тройки нуклеотидов называются также триплетами, а в контексте синтеза белка - кодонами. Кодон - это кодирующий триплет. Триплет, кодирующий начало синтеза белка называется старт-кодоном, а триплет, кодирующий окончание синтеза, называется стоп-кодоном (их несколько).

Из сказанного сразу становится понятно, что генетический код, как алгоритм, можно изложить полностью выписав список «значений» всех возможных триплетов нуклеотидов. Поскольку всего существует 4 разных нуклеотида, то всех разных триплетов существует всего 4×4×4, т.е. 64. Это заметно больше числа разных аминокислот (их 20, как Вы помните), даже если прибавить к ним сигнал окончания синтеза, как ещё одно возможное значение. Значит, обязательно, «значения» кодонов будут повторяться. Как оказалось, когда расшифровали генетический код, повторяющиеся значения кодонов разбросаны среди всех кодонов не хаотично: часто совпадают кодируемые значения кодонов, у которых совпадают первые два нуклеотида. Поэтому, традиционно генетический код изображают в виде таблицы, в которой кодоны сгруппированы по первых и вторым нуклеотидам, чтобы кодоны с одним «значением» чаще находились рядом друг с другом. Впрочем, лучше это увидеть своими глазами на следующей иллюстрации:

Рис. 20 Таблица генетического кода. Зелёным подсвечен старт-кодон, а красным - три стоп-кодона.

Ну вот мы и увидели, что такое тот самый «стандартный генетический код», о котором идёт речь в рассказе о «Сообщении». На этом я завершаю техническое предисловие к «Сообщению Творца в стандартном генетическом коде».

Продолжение: Последнее предисловие к рассказу о «Сообщении» Творца в генетическом коде.

вера, наука, естественная апологетика, Сообщение в генетическом коде