Оригинал взят у
caenogenesis Введение в биологию (начало) Введение в биологию. Часть №1 Тема III
БЕЛКИ
Белки, или протеины - огромные молекулы, которые есть во всех современных живых организмах. Термин “белок” (albumin) был в ходу еще с XVIII века и относился к веществам, подобным белку куриного яйца. Термин “протеин” (от греч. πρώτειος, “первичный”) предложил в 1838 году Йенс Якоб Берцелиус (Jöns Jakob Berzelius), известный также как автор терминов “изомерия”, “аллотропия”, “катализ”, “органическая химия” (
Vickery, 1950). По-русски “белок” и “протеин” - синонимы.
Берцелиус имел в виду, что “протеины” суть некие первичные строительные блоки живых организмов, и был совершенно прав. По смыслу “протеин” безусловно точнее, чем “белок”, но так уж исторически сложилось, что в русском научном языке “белок” употребляется гораздо чаще, и мы будем этому следовать.
Белки относятся к полимерам, то есть молекулам, состоящим из множества однотипных (но не обязательно одинаковых) звеньев-мономеров. На картинке - два примера случайно выбранных простых полимеров, не имеющих к белкам никакого отношения. Это углеводороды - полиэтилен и полистирол.
Мономерами всех белков являются альфа-аминокислоты, то есть такие аминокислоты, у которых аминогруппа и карбоксильная группа связаны с одним и тем же атомом углерода. Перед нами их общая формула. R (радикал) - как всегда, изменяемая часть молекулы.
Напомним, что аминогруппа и карбоксильная группа, которые по определению есть в любой аминокислоте, в водном растворе ионизируются. Вот тут альфа-аминокислота изображена в двух вариантах: слева - стандартный вид, справа - цвиттер-ион, где карбоксильная группа потеряла протон, а аминогруппа, наоборот, приобрела его. Заодно можно обратить внимание на то, что отрицательный заряд в цвиттер-ионе на самом деле делокализован ("размазан") между двумя атомами кислорода карбоксильной группы, а не привязан строго к одному из них.
Почему альфа-аминокислоты называются "альфа" и при чем тут вообще греческие буквы? Чтобы разобраться, посмотрим внимательно вот на эту формулу:
Атомы углерода, образующие аминокислоту, принято обозначать по порядку греческими буквами, считая от карбоксильной группы (сама она в счет не идет). Таким образом, первый атом углерода после карбоксила - это альфа-атом, второй - бета-атом, третий - гамма-атом и так далее. Аминокислоты классифицируются по тому, к какому атому углерода присоединена аминогруппа: альфа-аминокислоты - к первому, бета-аминокислоты - ко второму, и так далее, опять же. В состав белков, как уже сказано, входят только альфа-аминокислоты. А вот на картинке у нас в данном случае гамма-аминокислота. Конкретно это соединение называется гамма-аминомасляной кислотой (ГАМК) и присутствует в некоторых живых организмах, во-первых, как промежуточный продукт обмена, а во-вторых, как нейротрансмиттер - сигнальное вещество, передающее возбуждение от одной нервной клетки к другой. Ни в какие белки ГАМК, разумеется, не входит.
Вот простенькая иллюстрация того, как альфа-аминокислоты соединяются в белок. От карбоксила одной аминокислоты отщепляется -OH, от аминогруппы другой -H, из них образуется вода (H-O-H), а остатки аминокислот соединяются по свободным валентностям связью, которая называется пептидной. Цепочка аминокислот, соединенных пептидными связями, соответственно называется пептидом. Это более широкое понятие, чем белок; иначе говоря, все белки - пептиды, но не все пептиды - белки.
Тут мы видим более красивую и подробную схему, изображающую, однако, абсолютно то же самое. Разберемся в ней. Во-первых, после замыкания пептидной связи в возникшей новой молекуле тем самым образуется пептидная группа -CO-NH-. Во-вторых, обе аминокислоты теперь показаны в ионизированном виде - как мы уже знаем, это скорее всего соответствует действительности, хотя и не имеет для нас сейчас принципиального значения. В-третьих, радикалы аминокислот - R1 и R2 - в общем случае, конечно, могут быть разными. И в-четвертых, реакция образования пептида тут показана идущей в обе стороны, то есть обратимой. В самом деле, пептиды могут как синтезироваться, так и распадаться обратно на отдельные аминокислоты.
Короткие пептиды называются или по числу аминокислотных остатков (дипептид, трипептид, тетрапептид...), или просто олигопептидами.
В состав белков входит 20 стандартных аминокислот. Самые простые из них - глицин и аланин. У глицина радикал представляет собой просто атом водорода, а у аланина метильную группу. Аминокислоты, входящие в состав белков, коротко называют протеиногенными.
Для читателей-эрудитов добавим, что нестандартные аминокислоты (селеноцистеин, пирролизин, гидроксилизин, гидроксипролин) так или иначе являются производными стандартных и нас пока не интересуют. Наша задача - разобраться с основами.
Так выглядит образование дипептида из глицина и аланина. Обратим внимание, что это всего лишь один из двух возможных вариантов. Тут в создании пептидной связи участвуют карбоксильная группа глицина и аминогруппа аланина. Могло бы быть и наоборот, и тогда это был бы другой дипептид.
Еще три аминокислоты с углеводородными радикалами, более сложными, чем у аланина. Видим, что лейцин и изолейцин - изомеры, они отличаются всего лишь положением одной метильной группы.
Две аминокислоты с ароматическим ядром в радикале: фенилаланин и тирозин. Стрелка показывает, что тирозин является биохимическим производным фенилаланина. У фенилаланина радикал чисто углеводородный, у тирозина там есть еще спиртовая группа.
Еще две интересные аминокислоты - серин и цистеин. В серине есть гидроксильная группа, то есть, иначе говоря, радикал у него спиртовой. В цистеине есть ранее не встречавшаяся нам сульфгидрильная группа -SH. Валентность серы (S) здесь 2.
Теперь посмотрим на эту молекулу. Свежего человека такая формула, возможно, напугала бы, но у нас сейчас уже достаточно знаний, чтобы разглядеть в ней функциональные группы и сказать: это трипептид из остатков аланина, тирозина и цистеина. На его концах, как и положено, находятся свободные амино- и карбоксильная группы (на самом деле в растворе они ионизированы). Для краткости конец пептида со свободной аминогруппой всегда называют N-концом, а конец со свободной карбоксильной группой - C-концом.
Все протеиногенные аминокислоты, перечисленные до сих пор, являются нейтральными (как показанный на картинке для примера валин). Это означает, что в растворе такая аминокислота имеет нулевой заряд: карбоксильная группа и аминогруппа, будучи обе ионизированными, компенсируют друг друга, а других заряженных групп тут нет. На самом деле заряд такой аминокислоты будет строго нулевым не всегда, а только при определенной кислотности раствора, но мы сейчас берем идеальный случай.
Существуют отрицательно заряженные аминокислоты, у которых в радикале есть карбоксильная группа. Перед нами две такие аминокислоты - аспартат и глутамат. Отличаются они фактически только на один атом углерода в цепочке-радикале.
Примечание. В биохимии названия кислот и их солей очень часто используются как синонимы: в растворе, в диссоциированном виде, они все равно неотличимы. Например, аспартат - это на самом деле соль аспарагиновой кислоты, а глутамат - соль глутаминовой кислоты, но реально "глутаминовая кислота" и "глутамат" - это одно и то же; последнее название предпочитают просто для краткости. Дело в том, что соль - это по сути не что иное, как кислота, у которой на месте протона любой другой катион. Если такая молекула ионизирована и не имеет никаких катионов вообще, то за ней обычно оставляют название соответствующей соли. Именно это мы на примере аспартата с глутаматом и видим.
Аспарагиновая и глутаминовая кислоты в неионизированном виде. Сейчас это именно кислоты, но их все равно могут обозвать аспартатом и глутаматом для удобства.
Глутамат интересен не только тем, что входит в состав белков, но и тем, что является очень важным и широко распространенным нейротрансмиттером, то есть веществом, передающим сигналы в нервной системе. К тому же к глутамату чувствительны наши вкусовые рецепторы, и его часто добавляют в пищу, причем как в виде кислоты (пищевая добавка E620), так и в виде натриевой соли (пищевая добавка Е621).
Пример положительно заряженной аминокислоты - лизин (в ионизированном и стандартном виде). Тут, как видим, в радикале присутствует аминогруппа, которая ведет себя, как аминогруппе и положено - приобретает протон.
Аргинин - положительно заряженная аминокислота, в радикал которой входит довольно экзотичная гуанидиновая группа (больше она нам нигде не встретится). Положительный заряд в радикале аргинина делокализован между двумя атомами азота, поэтому электростатическое действие у него эффективнее, чем у такого же заряда в лизине; грубо говоря, он надежнее притягивает к себе "минус". Также обратим внимание, что на правой картинке углеродные атомы по порядку подписаны греческими буквами; в данном случае гуанидиновая группа соединена с эпсилон-атомом.
Подводя итог, мы можем разделить известные нам аминокислоты на четыре группы по типам радикалов:
● Нейтральные гидрофобные (аланин, валин, лейцин, изолейцин, фенилаланин).
● Нейтральные гидрофильные (серин, цистеин, тирозин).
● Отрицательно заряженные (аспартат, глутамат).
● Положительно заряженные (лизин, аргинин).
Особое положение занимает самая простая из всех возможных аминокислот - глицин, у которого вместо радикала атом водорода.
Очевидно, что свойства радикалов сильно влияют на поведение пептидной цепочки в растворе.
Посмотрим на схему типичного пептида, в данном случае состоящего всего из пяти аминокислот. Надо заметить, что это очень мало. Длинные пептиды с многими десятками аминокислотных остатков (от 50 и больше) называются полипептидами. Все белки - полипептиды. Аминокислотных остатков в них чаще всего даже не десятки, а сотни. Порядок аминокислот в белке принято принято перечислять от N-конца (аминогруппа) к C-концу (карбоксил).
А теперь представим, что молекулу пептида бросили в воду. Очевидно, что она не останется там вытянутой в линию, а будет как-то сворачиваться. Иными словами, молекула белка в воде обязательно примет некоторую трехмерную форму (конформацию), которая будет зависеть от взаимодействий между ее частями и особенно между радикалами аминокислот. А ведь эти радикалы, как мы уже знаем, бывают очень разными.
Принято выделять четыре уровня структуры белка:
● Первичная структура - последовательность аминокислотных остатков, соединенных пептидными связями.
● Вторичная структура - взаимодействия между аминокислотами в составе одной и той же пептидной цепочки, расположенными близко (через считанные остатки друг от друга).
● Третичная структура - взаимодействия между аминокислотами в составе одной и той же пептидной цепочки, расположенными сколь угодно далеко, хоть на разных ее концах.
● Четвертичная структура - взаимодействия между разными пептидными цепочками, собранными в функциональный белок. Если белок состоит из одной полипептидной цепи, то четвертичной структуры у него нет.
Первичная структура одномерна, все остальные - трехмерны. К первичной структуре относятся пептидные связи, к остальным уровням - любые другие взаимодействия между аминокислотными остатками.
Первичная структура - это просто сама последовательность аминокислот, например: глицин, пролин, глицин, треонин, глицин, глутамат... и так далее. Показанный слева пептид из 24 аминокислот - условность, настоящие белки очень редко бывают такими маленькими. Показанный справа белок из 129 аминокислот - гораздо более типичная штука, хотя даже такой белок считается небольшим. В обоих случаях цепи нарисованы изогнутыми исключительно для удобства и наглядности, на самом деле с таким же успехом можно было бы просто перечислить аминокислоты в строчку (как это и делается в соответствующих базах данных).
Объемная структура белковой молекулы (вторичная, третичная и четвертичная) держится на следующих типах взаимодействий между аминокислотными остатками:
● Водородные связи (как между полярными боковыми цепями аминокислот, так и между пептидными группами).
● Электрическое притяжение между положительно и отрицательно заряженными боковыми цепями.
● Гидрофобные взаимодействия между углеводородными боковыми цепями. Напомним, что гидрофобными называются молекулы или части молекул, в которых нет полярных связей и которые поэтому плохо взаимодействуют с водой. А вот слипаться вместе, чтобы уменьшить поверхность собственного взаимодействия с водой, они как раз склонны. Такое слипание может быть довольно прочным - оно и называется гидрофобным взаимодействием или даже гидрофобной связью.
● Дисульфидные мостики между остатками аминокислоты цистеина.
Все эти взаимодействия, кроме дисульфидных мостиков - нековалентные. А вот о самих дисульфидных мостиках мы еще не говорили. Они образуются между остатками аминокислоты цистеина, боковая цепь которой имеет вид -CH2-SH. Уже после того, как белок синтезирован, между входящими в него остатками цистеина может произойти вот такая реакция:
У остатков цистеина будет отобран водород (его унесут специальные молекулы-переносчики), а свободные валентности атомов серы замкнутся друг на друга, образовав дисульфидный мостик -S-S-. Белок вполне может быть в нескольких местах "сшит" такими мостиками. Реакция их образования в принципе обратима - дисульфидные мостики могут возникать и рваться, это имеет значение в некоторых физиологических процессах.
Вот очень простая и наглядная схема взаимодействий между аминокислотными остатками, влияющих на пространственную структуру белка. Пептид A и пептид B - это, скорее всего, части одной и той же полипептидной цепочки, сложенной пополам; но это могут быть и две совершенно самостоятельные полипептидные цепочки в случае, если мы имеем дело с четвертичной структурой. Слева мы видим обычную водородную связь, образованную боковыми цепями серина и еще не встречавшейся нам протеиногенной аминокислоты, которая называется аспарагин (не путать с аспартатом). Дальше - гидрофобное взаимодействие между двумя остатками валина, еще дальше дисульфидный мостик, и наконец, справа - боковые цепи лизина и аспартата, между которыми в данном случае возникает самая настоящая ионная связь.
Еще раз отметим, что все перечисленные взаимодействия могут возникать как между разными полипептидными цепочками (это будет называться четвертичной структурой), так и внутри одной полипептидной цепочки (это будет вторичная или третичная структура).
Два самых распространенных типа вторичной структуры белка - α-спираль и β-слой. В целом вторичная структура характеризуется тремя особенностями:
● Держится в основном на водородных связях, входящих в состав пептидных групп (а не боковых цепей).
● Задействует аминокислоты, расположенные относительно близко друг от друга - например, в α-спирали водородные связи постоянно образуются между аминокислотными остатками с номерами n и (n+4), то есть каждый остаток образует водородную связь с остатком, четвертым по счету от него.
● Обладает высокой регулярностью. В α-спирали это сразу бросается в глаза, в β-слое, где водородные связи образуются между противоположно направленными цепочками, молекула белка должна быть несколько раз равномерно сложена.
Альфа-спираль энергетически особенно устойчива, в частности, за счет того, что внутри нее в образовании водородных связей принимают участие все пептидные группы без исключения.
Третичная структура держится на взаимодействиях между сколь угодно далекими (но принадлежащими к одной и той же цепи) остатками аминокислот и определяет, какую форму будет иметь молекула белка целиком. О том, какие взаимодействия создают третичную структуру, мы уже говорили: это водородные связи между боковыми цепями, гидрофобные взаимодействия и ионные связи (см. картинку).
На этой схеме тоже прекрасно показаны источники третичной структуры: (a) ионная связь, (b) водородная связь, (c) дисульфидный мостик, (d) гидрофобные связи, и в том числе очень интересный их вариант, который называется стэкинг-взаимодействием - слипание наложившихся друг на друга ароматических ядер. Полезно рассмотреть картинку повнимательнее и самостоятельно разобраться, какие аминокислоты здесь участвуют.
Ответ: глутамат, лизин (ионные связи), тирозин, аспартат (водородные связи), изолейцин, аланин (гидрофобные связи), фенилаланин (стэкинг-взаимодействие), цистеин (дисульфидный мостик). Два цистеина, соединенные ковалентной связью через серу, называются цистином. Кроме того, тут отмечено взаимодействие аминокислотных остатков с молекулами воды и углекислоты - и то и другое тоже бывает важно.
Вот полная пространственная структура одного совершенно случайно выбранного белка-глобулина, присутствующего в нашей крови. Это уже довольно реалистичная трехмерная схема. Альфа-спирали (спирали) и бета-слои (противоположно направленные стрелки) - элементы вторичной структуры; то, во что они собраны все вместе - третичная структура. Четвертичной структуры здесь нет.
Пример белка с четвертичной структурой - антитело из нашей иммунной системы. “Тяжелые” и “легкие” полипептидные цепи синтезируются отдельно, после чего сшиваются дисульфидными мостиками. Обозначения разных отрезков самих цепей нас не интересуют, но стоит обратить внимание, что тут по всем правилам указаны N- и C-концы.
Еще один пример белка с четвертичной структурой - гемоглобин. Он состоит из двух α-цепей и двух β-цепей, которые синтезируются отдельно. Вместе они удерживаются в основном за счет гидрофобных взаимодействий. Особенность гемоглобина - в его состав входит ион железа, образующий комплекс с особой группой, которая называется гемом и вовсе из аминокислот не состоит. Такие дополнительные группы - нечастое явление, но в сложных белках они встречаются.
Потеря белком своей пространственной структуры без разрушения пептидных связей (то есть первичной структуры) называется денатурацией. Самый простой способ денатурировать белок - нагреть его. Альтернативный вариант - например, высокая кислотность. Именно частичная денатурация белков происходит при любой термической обработке пищи, причем иногда этот процесс до некоторой степени обратим (при кипячении молока, например). Восстановление пространственной структуры денатурированного белка называется ренатурацией. Белок крутого яйца после полной денатурации растворенных там молекул белков становится твердым, потому что раскрученные полипептидные цепочки перепутываются между собой.
Очень важный биологический факт состоит в следующем: зная первичную структуру белка (то есть аминокислотную последовательность), теоретически можно точно предсказать его пространственную структуру всех уровней. Это достаточно успешно делается методами биофизики и биоинформатики. Иными словами, зная аминокислотную последовательность, мы тем самым получаем полную информацию о белке: при данной последовательности он, как правило, сворачивается всегда совершенно одинаково. Дальше мы увидим, какое огромное значение это имеет для устройства живых систем.
Биохимическая эволюция началась еще до образования Земли как планеты. В так называемых углистых метеоритах встречаются углеводороды с длинными (до 30 атомов) углеродными цепочками, многоатомные спирты, альдегиды, кетоны, углеводы, карбоновые кислоты, амины. Есть там и аминокислоты, причем очень разнообразные - с разным расположением аминогрупп (α-, β-, γ-, δ- и ε-аминокислоты), с двумя аминогруппами и с другими особенностями (
Pizzarello, Shock, 2010). Большинство этих аминокислот не было “выбрано” эволюцией на роль протеиногенных.
Уже на этом уровне происходил процесс, аналогичный естественному отбору. Интересно поразбираться в причинах, по которым одни аминокислоты были выбраны на роль протеиногенных, а другие нет; сейчас мы попробуем кое-что на эту тему сказать. Пока добавим, что метеориты, о которых идет речь, никогда не входили в состав планет, поэтому их химический состав не искажен действием высоких температур и давлений, господствующих в планетных недрах. Это своего рода химический "заповедник" очень древней эпохи Солнечной системы.
Эта аминокислота (по химическим правилам ее можно назвать 2,2-диамино-3-метилпентановой кислотой) была бы изолейцином, если бы не дополнительная аминогруппа в α-положении. Она может служить представителем огромного добиологического разнообразия аминокислот. Из “метеоритных” аминокислот в состав белков вошли только восемь: глицин, аланин, пролин, валин, лейцин, изолейцин, аспартат и глутамат.
Изовалин - аминокислота, которая не соответствует общей формуле протеиногенных аминокислот (хотя не так уж и сильно отличается от них), не синтезируется и не разлагается никакими земными живыми организмами, но встречается в метеоритах. Это еще одна из многих аминокислот, не прошедших отбора на протеиногенность.
Почему же одни аминокислоты вошли в состав белков, а другие нет? Скорее всего, дело в том, что аминокислота с двумя радикалами или с двумя аминогруппами при одном и том же углероде уменьшает разнообразие возможных конформаций пептидов, которые из таких мономеров будут сложены. У диаминометилпентановой кислоты при α-атоме находятся две аминогруппы, у изовалина - два углеводородных радикала; и то и другое должно ограничивать число возможных конформаций полипептидной цепочки, делая ее менее гибкой. У всех без исключения протеиногенных аминокислот одна из валентностей α-атома занята простым водородом. И это, конечно, не случайность. Уже известная нам общая формула протеиногенной аминокислоты - не изолированный факт, который можно только зазубрить, а вполне объяснимый продукт эволюции.
Любой отдельный белок (если это именно белок, а не просто случайный полипептид) сам по себе тоже является продуктом эволюции, и его структура приспособлена для выполнения какой-то строго определенной функции. Известный биофизик Лев Александрович Блюменфельд писал: "Если бы для описания клетки нам пришлось выбирать между двумя крайними моделями - часовым механизмом и гомогенной химической реакцией в газовой фазе, - выбор был бы однозначен: клетка несравненно ближе к часовому механизму, чем к чисто статистической системе" (
Блюменфельд, 1977). Этот принцип действует не только на уровне целой клетки - он относится и к отдельным молекулам биополимеров, то есть в первую очередь белков. Блюменфельд как раз и начинает вышеприведенными словами главу своей книги, посвященную биофизике молекул белка.
Разнообразие функций белков огромно. Очень краткий и неполный их список может выглядеть примерно так:
● Структурная (например, белки соединительной ткани или кератин, из которого состоят волосы и ногти).
● Каталитическая (ферменты).
● Сигнальная (гормоны, рецепторы).
● Транспортная (например, гемоглобин переносит кислород).
● Моторная (белки мышц, ресничек, жгутиков).
● Защитная (антитела, яды).
Из всех этих функций мы сейчас специально обсудим только одну - каталитическую.
Начнем с простых определений. Вещество, ускоряющее химическую реакцию, но само не претерпевающее в ней стойких изменений, называется катализатором. Катализатор, являющийся белком, называется ферментом. Практически все биохимические реакции идут с помощью специальных ферментов. Вещество, являющееся исходным для той реакции, которую катализирует данный фермент, называется его субстратом. Часть молекулы фермента, непосредственно взаимодействующая с молекулой субстрата, называется активным центром. Обычно активный центр занимает только небольшую часть молекулы фермента.
На приведенной картинке показан фермент, катализирующий распад молекулы субстрата на две части. Так бывает, но надо иметь в виду, что это частный случай. С таким же успехом фермент может и "сшивать" две молекулы в одну, и просто превращать одну молекулу в другую, и вообще делать что угодно. Номенклатура ферментов довольно сложна, но в большинстве случаев название фермента складывается из названия субстрата и характерного окончания "-аза".
Активный центр взаимодействует с субстратом по так называемому принципу ключа и замка. Надо учитывать, что “замок” (активный центр) при связывании с “ключом” (субстратом) сам обратимо меняет конформацию. Во время такой реакции молекула фермента фактически действует как довольно сложная механическая машина, имеющая множество шарниров, сочленений, поворачивающихся частей и тому подобного (
Хургин и др., 1967).
Каждый фермент специализирован для строго определенной химической реакции. Например, фермент сукцинатдегидрогеназа связывает сукцинат (соль янтарной кислоты) и превращает его в фумарат (соль фумаровой кислоты). Это нормальный ход реакции (a). Если на месте сукцината окажется малонат - соль малоновой кислоты, отличающейся от янтарной на один углерод - он тоже свяжется с активным центром, но никакой реакции не пойдет. Сукцинат будет как бы конкурентно вытеснен малонатом, который "застрянет" в активном центре фермента и заблокирует его (b). Это называется конкурентным ингибированием. Именно на конкурентном ингибировании основано действие многих лекарств и ядов.
Вот схема активного центра фермента ацетилхолинэстеразы, расщепляющего некую молекулу под названием ацетилхолин:
Что мы видим тут на картинке? В ацетилхолине есть:
● метильные группы (-CH3), для связывания которых активный центр образует гидрофобные “карманы” (hydrophobic pockets);
● атомы кислорода, для связывания которых активный центр имеет остаток аспарагина (Asn) - незаряженной, но полярной аминокислоты, легко образующий водородные связи;
● положительный заряд, для ионного связывания которого предназначен остаток аспартата (Asp);
● наконец, довольно протяженная углеводородная часть, для создания гидрофобных связей с которой служит ароматическое ядро остатка тирозина (Tyr).
И все это находится точно на своих местах. Стоящие на картинке числа - номера аминокислотных остатков в первичной структуре. Из них, в свою очередь, видны две вещи. Во-первых, всего в ацетилхолинэстеразе больше 600 аминокислот. Такой белок уже действительно считается большим, а активный центр занимает лишь его маленькую часть. Во-вторых, аминокислоты, оказывающиеся рядом в активном центре, могут в первичной последовательности находиться очень далеко - например, за 300 остатков друг от друга. Их "правильное" взаимное расположение достигается за счет очень точного сворачивания полипептидной цепи, то есть за счет третичной структуры. Можно представить, насколько сложной биохимической машиной является такой фермент. А в каждой живой клетке ферментов несколько тысяч.
“Белковая Вселенная” - воображаемое пространство, в каждой точке которого находится один белок. Число измерений равно числу аминокислотных остатков в этом белке, а вдоль каждой из осей переменная может принимать 20 значений, по числу стандартных протеиногенных аминокислот. Имеет смысл подчеркнуть, что “белковая Вселенная” - это не поэтическая метафора, а на сегодняшний день уже повседневный инструмент работы биоинформатиков, почти как пространство декартовых координат в математическом анализе. Простейшая “Вселенная”, описывающая дипептид, имеет всего два измерения и состоит из 400 возможных точек (202).
С ростом длины белка объем “белковой Вселенной” быстро растет. Для белка из 300 аминокислот (а это типичный размер) “Вселенная” является 300-мерной и включает 20300 возможных состояний - это гораздо больше, чем общее число протонов и нейтронов в наблюдаемой части физической Вселенной (1080). Очевидно, что до сих пор эволюция исчерпала лишь ничтожную часть этого объема.
Показано, что “белковая Вселенная” расширяется, подобно физической Вселенной: с ходом эволюции белки все сильнее отличаются друг от друга (
Povolotskaya, Kondrashov, 2010). На иллюстрации слева - расширяющаяся физическая Вселенная (указаны небесные объекты), справа - расширяющаяся белковая Вселенная (указаны одноклеточные организмы, первичную структуру белков которых авторы сравнивали). "Эдвин Хаббл обнаружил, что галактики удаляются друг от друга, причем расстояние между галактиками положительно коррелирует со скоростью их разлетания. Экстраполируя эту тенденцию в прошлое, Хаббл пришел к выводу, что разлетание должно было начаться из одной точки. Эта идея легла в основу современной теории Большого взрыва. Нечто подобное происходит и с белками, расходящимися от общего предка" (
Марков, 2010).
Это изображение окружающей нас части физической Вселенной в очень мелком масштабе - нанесенная на карту линейка соответствует миллиарду световых лет. Суперкластер Девы (Virgo Supercluster) включает 30 тысяч галактик, лишь одной из которых является Млечный Путь. Но в этом масштабе весь суперкластер Девы выглядит ничтожно маленькой областью. Вот примерно так же устроено пространство белковых последовательностей, в котором идет эволюция. А ведь могут быть еще и другие, небелковые биологические Вселенные.