Распознавание дизайна: основные понятия

Aug 21, 2018 16:28

Основные понятия изложены в алфавитном порядке. Полужирным выделены термины, объяснение которых можно найти в этом документе.


Абдукция
От лат. abductio - отвожу. Способ рассуждения, ориентированный на поиск правдоподобных объяснительных гипотез. А. состоит в исследовании фактов и в построении гипотезы, которая их объясняет. А. и индукция начинают с фактов, но по-разному их исследуют. Если индукция ищет факты, подтверждающие ее заключение, то А. направлена на установление определённой регулярности между фактами. Эта регулярность выражается в виде предварительной гипотезы, которая после многократных уточнений смогла бы объяснить данные факты. Логическая форма абдуктивного рассуждения представляется в следующем виде.
  • Имеется некоторое наблюдение.
  • Оно было бы объяснено, если выдвигаемая гипотеза была бы истинной.
  • Следовательно, имеется основание думать, что выдвигаемая гипотеза истинна.
Дедуктивное рассуждение представляет собой такую последовательность суждений:
  • Большая посылка (общее суждение, включает квантор общности: все, любой, всякий, каждый): Все люди смертны.
  • Малая посылка (субъект этого суждения является элементом множества в большой посылке, а предикат субъектом большой посылки): Сократ - человек.
  • Вывод (суждение о субъекте в малой посылке такое, что предикатом его является предикат большой посылки): Сократ смертен.
Говорят, что дедуктивное рассуждение объясняет вывод.

Абдукция отличается от дедукции перестановкой малой посылки и вывода:
  • Большая посылка (общее суждение, включает квантор общности: все, любой, всякий, каждый): Все люди смертны.
  • Малая посылка (наблюдение): Сократ смертен.
  • Абдуктивный вывод (гипотеза): Сократ -- человек.
Абдуктивный вывод является гипотетическим: Сократ смертен, вероятно, потому что Сократ - человек, раз все люди смертны. Строго говоря, мы не знаем, человек ли Сократ, мы лишь предполагаем это. При построении объяснения наблюдений абдукция предваряет дедукцию: сначала выдвигаются гипотезы, а затем они встраиваются в дедуктивную объяснительную схему, где гипотеза становится "на своё место" малой посылки.

Как это выглядит на практике, скажем, применительно к гипотезе дизайна биологических систем? Есть наблюдения ряда свойств, общих лишь для биосистем и некоторых сложных технологических артефактов, а именно: возможность обратной разработки, использование дискретного кода, наличие семиотического ядра (пирсовой тройки: знак, референт, интерпретант), защита от шумов, отказобезопасное дублирование функций и пр., подробнее см. Абдукция, дедукция и гипотеза дизайна). Обозначим эти свойства символом Х. На рис.1 показаны абдуктивное и дедуктивное рассуждения применительно к гипотезе дизайна. Абдуктивный вывод (гипотеза дизайна) в данном случае такова: сложная биофункция является сложнофункциональным дизайном. Наблюдение состоит в том, что сложная биофункция обладает свойствами Х. Выдвинутая абдуктивно гипотеза участвует в дедуктивном объяснении наблюдений в качестве малой посылки.



Рис.1 Абдуктивное и дедуктивное рассуждения

Агент

Внешний по отношению к исследуемой системе актор, создающий некоторый паттерн. Другие термины, обозначающие агента:
  • Интеллектуальный агент;
  • Лицо, принимающее решения. В данном случае под решениями имеются в виду шаги по достижению желаемой цели, заключающейся в создании того или иного паттерна.

Альтернативное состояние системы

Одно из состояний статического, динамического, химического или термодинамического равновесия исследуемой системы. Достаточно широкие зоны равновесия предоставляют возможность наложения правил функционирования. Например, альтернативами могут трактоваться положения вкл/выкл горизонтально расположенного переключателя, различные положения шахматной фигуры на доске в контексте игры, а также различные последовательности нуклеотидов матричной РНК. Как известно, полимеризация мРНК характеризуется практически полным отсутствием химической избирательности, поэтому, с химической точки зрения, возможна реализация любой последовательности. Таким образом, существует возможность выбора тех или иных последовательностей по прагматическому критерию: например, с тем, чтобы синтезировать функциональную цепочку аминокислот, то есть такую, которая уложится затем в трехмерную структуру, обеспечивающую конкретное белковое взаимодействие (скажем, связывание АТФ миозином).

Верхняя оценка количества функциональной информации, способной накопиться в системе

Оценка максимально возможного количества информации Imaxнеинтел., генерируемого засчёт неинтеллектуальных факторов (засчёт движения вещества системы в результате природных регулярностей и факторов случайного характера). Оценка зависит от исследуемой системы, а также от принимаемых допущений (например, от того, какие состояния рассматривать: химические, квантовые и пр. или, как в примере, рассмотренном ниже, число репликаций живых организмов в предположении, что вся биота размножается со скоростью одноклеточных).

Оценка Imaxнеинтел. должна быть подсчитана корректно. В противном случае возможно некорректное распознавание дизайна, выражающееся в ложных положительных результатах теста, когда паттерны, не являющиеся дизайнами, классифицируются как дизайны. С другой стороны, завышение верхней оценки приводит к уменьшению чувствительности тестирования, что выражается в возрастании числа ложных отрицательных результатов, когда дизайны не распознаются.

Пример. Выведем оценку максимального количества функциональной информации Imaxнеинтел., способной накопиться в результате эволюционных движений биоты. Для этого оценим число состояний, которые могли быть просмотрены эволюционным блужданием за всю историю биосферы. Ещё раз подчеркнём, что это верхняя оценка, выводимая из оптимистических оценок влияющих на неё факторов. Иными словами, эти оценки целенаправленно выводятся со значительной "форой" (то есть гарантированно благоприятно) для нулевой гипотезы, согласно которой исследуемый паттерн не является дизайном.
  • Всего бактерий на Земле: 5 * 1030 (см. напр. здесь). Будем считать это число оценкой размера биоты на всём протяжении её жизни.
  • Средняя частота мутаций на геном на поколение (mean mutation rate per genome per cell generation): 3 * 10-3 (см. здесь).
  • Среднее число поколений бактерий в день: 30 (по Докинзу, описавшему длительный эксперимент по эволюции одноклеточных, это число составляет 6-7, так что мы даём фору).
  • Максимальная оценка числа дней в распоряжении эволюции: 1.825 * 1012 (из расчёта 5 миллиардов лет).
  • Перемножаем все эти числа. Получаем: 8.2125 * 1041 состояний, которые могут быть просмотрены эволюционным блужданием, то есть порядка 1042 = 2140 состояний.
  • Итак, максимальное количество функциональной информации, которая может быть произведена неинтеллектуально эволюционными движениями биоты, составляет Imaxнеинтел. = - log2(1/2140) = log22140 = 140 бит. Следует иметь в виду, что это оценка сверху, причём весьма оптимистичная, с точки зрения возможностей эволюции. В данном случае мы предполагаем, что искомая функция максимально специфична (число синонимов функциональной строки, кодирующей некоторую функцию, равно 1, см. раздел Функциональная информация ниже). Это значительно завышает нашу оценку в пользу возможностей эволюции. Физический смысл оценки состоит в том, что 140 функциональных бит есть максимально возможный скачок функциональной информации, доступный эволюции. Иными словами, по предположению, на котором основана эта оценка, искомое эволюцией функциональное состояние единственно в пространстве размером 2140 состояний. Отыскание этого состояния в пространстве указанного размера случайным блужданием - maximum maximorum того, что может эволюция.
Из рассмотренного примера следует (см. также распознавание дизайна ниже), что, если независимый расчёт количества информации (например, BLAST-анализ), соответствующей изменениям структуры биоты (например, переходу от беспозвоночным к позвоночным организмам) покажет, что информационный скачок превышает 140 бит, то тест на дизайн данного структурного изменения можно считать положительным, причём чем больше информационный скачок превышает 140 бит, тем с большей уверенностью можно об этом утверждать. Примеров таких дизайн-положительных структурных усложнений в биоте множество. Так, первичная структура белков семейства рибосомальных s12 характеризуется 346 функциональными битами, а семейства RecA 976 функциональными битами [Durston et al]. Следовательно, можно с уверенностью заключить, что белки данных семейств дизайн-положительны.

Особо следует подчеркнуть, что выводимая оценка касается функциональной информации. Размер генома не коррелирует с функциональной сложностью (см. так называемый С-парадокс). Используемое здесь определение функциональной информации существенно отличается от информации Шеннона. См. также пояснения здесь и здесь.

Дизайн

Процесс интеллектуального создания паттернов, а также (в зависимости от контекста) и сами эти паттерны. Таким образом, по определению, паттерны, являющиеся дизайнами, имеют интеллектуальное происхождение. Например, дизайнами являются ноутбук, жилой дом, авторучка, рибосомальный белок s12, запись краской на заборе "Здесь был Вася", а также текст, который вы читаете. Следует отметить, что дизайны не обязаны быть сложно-функциональными. Дизайном, например, является и пятно краски, целенаправленно оставленное маляром на асфальте, надрез на коре берёзы, сделанный с целью сбора сока, и пр. Важнейшей характеристикой процесса дизайна является целенаправленность.

Функциональная сложность того или иного паттерна может быть оценена только в контексте, в котором определена соответствующая функция. Например, программный код может выполнить свою функцию только в системе, где имеется интерпретатор кода.

Дизайн-гипотеза

Формулировка 1. Паттерны, характеризующиеся достаточно высокими значениями функциональной сложности (выше порогового для рассматриваемой системы), могут быть созданы только интеллектуально. Вычисление порогового значения заключается в оценке максимальной функциональной сложности, способной генерироваться неинтеллектуально (например, эволюционно, если рассматриваемая сложная функция является биологической).

Формулировка 2. Признаком интеллекта является способность создания паттернов, характеризующихся достаточно большими количествами функциональной информации (функциональной сложности). Смысл выражения "достаточно большое количество функциональной информации" такой же, как для Формулировки 1.

Гипотеза дизайна основана на многочисленных наблюдениях неспособности таких природных факторов, как регулярности (физические или химические ограничения) или случайности (например, термодинамические флуктуации состояния или бифуркации нелинейных систем) достаточно быстро генерировать достаточно большие количества функциональной информации. Наблюдения также свидетельствуют о том, что относительно большие положительные дельты функциональной информации в исследуемой системе за относительно малые промежутки времени способен генерировать только интеллект. Наблюдаемая настройка параметров исследуемой системы (например, системы синтеза белка или текста, который вы сейчас читаете) на области параметрического пространства, соответствующие достаточно сложной функции, при условии крайней разряженности и крайней относительной малости функциональных областей в этом пространстве, по статистике указывает на то, что выбор именно таких параметров системы был произведён интеллектуально (именно такая, а не иная последовательность нуклеотидов в мРНК, по которой синтезируется именно такой белок; именно такая, а не иная последовательность символов русского алфавита в данном тексте несёт именно такой смысл). Чем длиннее осмысленный текст, тем больше функциональной информации он несёт и тем с большей вероятностью мы можем заключить, что он является дизайном.

О байесовских факторах для оценивания конкурирующих гипотез см. здесь.

Дизайноид

Паттерн, имеющий характеристики дизайна. Паттерн может быть дизайноидом, но при этом может не быть дизайном. Можно сказать иначе: любой дизайн является дизайноидом, но не каждый дизайноид есть дизайн (рис.2).



Рис.2 Типы паттернов

Интеллект

Способность принимать решения в контексте планирования для достижения целевого состояния (создания опредёленного паттерна).

Интеллектуальный агент

См. Агент.

Лицо, принимающее решение (ЛПР)

См. Агент.

Основная гипотеза дизайна

См. Дизайн-гипотеза.

Паттерн

Пространственно-временная конфигурация частиц вещества или напряжённости поля в исследуемой системе. Паттерны различаются по своим характеристикам: структуре, динамичности, регулярности, специфичности, сложности (в том числе функциональной), происхождению и т.д. Классификация паттернов по происхождению является целью распознавания дизайна.

Правила vs. ограничения

Живые системы, а также сложно-функциональные искусственные системы характеризуются помимо физико-химических ограничений, действующих вследствие природных регулярностей, правилами функционирования. К числу правил работы некоторого прибора (скажем, датчика задымления помещения) относится включение/выключение электрической цепи в отклик на регистрацию событий некоторого класса (превышение заданной концентрации угарного газа в помещении), тогда как наличие тока в проводнике по замыкании цепи является следствием природных регулярностей окружающего мира (так наз. законов природы, в частности, законов электромагнетизма: разность потенциалов вызывает движение электронов по проводнику). В отличие от неизменных природных регулярностей движения материи, проявляющихся всегда, правила представляют собой граничные условия на движение вещества в системе, которые иногда могут быть целенаправленно наложены на некоторую систему исходя из тех или иных прагматических соображений (с целью создания того или иного паттерна).

Прагматический критерий качества

Оптимизационный критерий качества решений, принимаемых в процессе достижения управляемой системой целевого состояния; критерий качества работы многокомпонентной системы, не сводящийся к физическим характеристикам движения. В теоретических исследованиях часто в роли прагматического критерия выступает обобщённая полезность (utility), выражающаяся в сохранении целостности и способности управляемой системы выполнять заданную функцию. Примеры прагматических критериев: цена, долговечность, экономичность, качество, надёжность, эстетика, количество используемых ресурсов и пр. В случае выбора автомобиля покупатель исходит из прагматических предпочтений (компромисс "цена/качество"). В случае живого организма в роли полезности может рассматриваться поддержание гомеостаза.

Принятие решений

Целенаправленный выбор из альтернатив. П. р. может осуществляться по прагматическому критерию. Выбор производится агентом. Стоит отметить, что выбор есть акт, действие; выбором не являются потенциальная возможность выбора, термодинамические флуктуации или бифуркации нелинейных систем.

Распознавание дизайна

Деятельность по оцениванию вероятности того, что исследуемый паттерн представляет собой дизайн. Оценивание производится с помощью анализа структуры паттерна. При этом могут быть использованы так называемые методы статистического тестирования гипотез. При р.д., основанном на анализе функциональной информации, ассоциированной с исследуемым паттерном, классификация паттерна по критерию дизайна может производиться, например, с помощью оценки вероятности p генерации паттерна без участия агента, или лица, принимающего решения, с последующим сравнением этого значения с пороговой вероятностью p*, вычисленной для системы, в которой реализован паттерн. При выполнении условия p < p* делается вывод о том, что исследуемый паттерн является дизайном. Качество классификатора зависит от точности вычисления значений p и p*. Следует иметь в виду, что невыполнение неравенства p < p* означает лишь невозможность с уверенностью заключить о происхождении паттерна только исходя из анализа его структуры без привлечения дополнительных данных.

Тест на дизайн

Абдуктивное гипотетическое заключение об интеллектуальном происхождении некоторого паттерна K, то есть о том, что появление K потребовало целенаправленной активности интеллектуального агента или агентов. Д.-р. можно рассматривать как процесс классификации K по признаку артефактности. Основой д.-р. является измерение количества I(K) функциональной информации, необходимой для производства K. Если I(K) является статистически значимым, то есть значительно превышает практически устанавливаемую верхнюю оценку количества Imaxнеинтел. информации, которая может быть произведена в системе неинтеллектуально, то с достаточной степенью уверенности можно заключить, что K должна была иметь интеллектуальное происхождение. Таким образом, статистически значимое количество функциональной информации указывает на предшествующий процесс принятия решений (при условии верности дизайн-гипотезы):

I(K) ≫ Imaxнеинтел. ⇒ дизайн(K) = ИСТИНА, (*)

где ⇒ означает абдуктивную импликацию, а дизайн(X) - булева функция, принимающая значение ИСТИНА в случае если K классифицируется как дизайн, и ЛОЖЬ в противном случае.

Например, тестом на дизайн является заключение эксперта-криминалиста о том, что смерть потерпевшего была насильственной, или вывод о дизайне рибосомального белка S12.

Далее, из приведённой формулы видно, что чем качественнее оценка Imaxнеинтел. максимального количества функциональной информации в системе, которое может быть произведено неинтеллектуально, тем точнее действует классификатор (*). И наоборот, при увеличении оценки Imaxнеинтел. практическая ценность классификатора падает.

И наконец, стоит обратить внимание на то, что классификатор (*) однонаправлен: при невыполнении условия I(K) ≫ Imaxнеинтел. о происхождении К ничего заключить нельзя. Поэтому ложный отрицательный результат (нераспознавание заведомого дизайна) свидетельствует лишь о недостаточной чувствительности классификатора (*) вследствие слишком завышенной оценки Imaxнеинтел. или же о том, что анализируемый дизайн не является достаточно функционально сложным. И только ложный положительный результат (классификация как дизайна паттерна, им не являющегося), если таковой когда-либо будет получен, станет опровержением дизайн-гипотезы (разумеется, при условии корректности используемой при этом верхней оценки).

Функциональная информация, информация в контексте функции f

Информация, ассоциированная с функцией f некоторого паттерна K; мера уменьшения неопределённости у наблюдателя как результат реализации К. Ф.и. измеряется в функциональных битах (англ. functional bits, fits). В том, что касается уменьшения неопределённости, понятие ф. и. схоже с информацией Шеннона в том смысле, что функциональная информационная энтропия вводится аналогично информационной энтропии модели Шеннона (см. статью "Информационная энтропия" в википедии). Тем не менее, ф. и., в отличие от информации Шеннона, отражает смысловую сторону паттерна, что особенно важно при исследовании проблем передачи информации в живых системах как в системах функциональных.

Для ф.и. относительно функции f и паттерна K справедливо:

0 ≤ If(K) ≤ IS(K),

где IS(K) - информация Шеннона, получаемая наблюдателем при реализации паттерна K.

Паттерны, характеризующиеся сложной функцией f, задают достаточно малую целевую область Of в пространстве возможных паттернов П. В качестве таких паттернов без потери общности можно рассматривать строки описания функции f на некотором языке. Тогда область Of будет соответствовать множеству синонимичных строк, каждая из которых является представлением функции f (рис.3).



Рис.3 Целевое пространство Of является подпространством пространства П возможных паттернов.
Каждый элемент Of реализует функцию f.
Чем меньше размер Of по сравнению с размером пространства П состояний, тем больше функциональной информации сообщает строка, кодирующая f. При заданном размере пространства П состояний наблюдатель получает максимально возможное количество информации в том случае, если функция максимально специфична (если не имеет синонимов, то есть при условии, что |Of| = 1). Минимальное количество функциональной информации равно 0, что выполняется в том случае, если любая строка из П задаёт функцию f (то есть когда специфичность функции f минимальна). В качестве меры сложности K можно рассматривать количество информации If, ассоциированной с функцией f, которое вводится следующим образом:

If = - log2 (|Of|/ |П|),

где |*| - размер, или число элементов множества *, то есть |Of| - число синонимичных строк, каждая из которых кодирует функцию f, |П| - размер пространства состояний, или число возможных строк заданной длины.

В контексте биосистем в качестве строк могут рассматриваться, например, нуклеотидные последовательности информационной РНК или последовательности аминокислот первичных белковых структур.

Рассмотрим два примера. Предположим, что наши строки, сложность которых мы оцениваем, составлены из букв русского алфавита, цифр, пробелов и знаков пунктуации. 33 буквы кириллицы плюс минимум 12 дополнительных символов  {".", ",", "-", "!", "?" ":", ";", "*", "+", "-", "/", " "} даёт алфавит мощностью 45.

Пример 1. Функция последовательности символов текста на данной странице состоит в передаче набора осмысленных утверждений о распознавании дизайна. Параметрическое пространство в этом случае представляет собой множество П всевозможных строк длины, равной числу символов на этой странице = 23463. Интуитивно ясно, что число M строк, кодирующих тот же смысл, что и смысл текста на этой странице, очень мало по сравнению с размером параметрического пространства. Следовательно, функция данного текста может быть охарактеризована как сложная. Мера сложности в данном случае: - log2 (M / |П|), где |П| есть число всевозможных строк длины 23463. Следовательно, пространство состояний в нашем случае 45-символьного алфавита имеет размер |П| = 4523463.

Пример 2. Пусть имеется обработчик текстовой информации, посылающий сигнал тревоги по получении строки s = "ТРЕВОГА" и игнорирующий любое другое сообщение. Для простоты ограничимся случаем, когда возможно получение сообщений строк длиной 7 символов. Предположим также, что, как в примере 1, алфавит содержит 45 символов. Следовательно,  |П| = 457. Тогда сложность строки s составляет I = - log2 (1 / |П|) = 7 log245 = 38.4 функциональных бита. Наконец, если обработчик может распознать не только строку s, но и инвертированную строку s, тогда строка sинв = "АГОВЕРТ" будет синонимичной s. В этом случае, сложность строки s или sинв составит: I = - log2 (2 / |П|) = 7 log2(45/2) = 31.4 функциональных бита. Отсюда видно, что при увеличении числа синонимичных строк специфичность каждой из них уменьшается, что влечет и уменьшение количества функциональной информации, которую несет каждая функциональная строка.

См. также:
Функциональный остров

Функциональным островом называется связное множество Of синонимичных функциональных паттернов. Связность понимается в смысле возможности замены синонимичных паттернов поисковым процессом (например, дарвиновским Random Variation + Natural Selection) без деградации f.

Поясним, что имеется в виду. Пусть в качестве паттернов рассматриваются строки некоторого заданного фиксированного алфавита (например, алфавитом может выступать набор двадцати протеиногенных аминокислот). Тогда остров задается множеством функциональных подстрок некоторой строки s, кодирующих фиксированную фитнес-функцию f (например, инфективность бактериофага). Подстрока s* ⊆ s ⊆ Of задаётся индексами символов в s. Связность означает возможность замены функциональной подстроки s1 ⊆ Of на другую функциональную подстроку s2 ⊆ Of поисковым процессом (в качестве которого может выступать дарвиновская эволюция) без уменьшения уровня f при условии фиксированного положения подстроки и её длины.

Например, пусть функция f независимо обеспечивается участками каждой из двух синонимичных строк, выделенными красным цветом и полужирным шрифтом:
  • MGKKGYKRNEYNNPFQQAWANPKHAWAQVNGETRLTQNLIILERETRKRS
  • MGKKGYKRNEYNNPFQAPWANPKHAWAQVNGETRLTQNLIILERETRKRS
В этом примере функциональный остров имеет размер 2, занимает позиции с 15 по 19. Внимание: размер острова определяется не длиной функциональной подстроки, а числом синонимов. Интуитивно понятно, что чем сложнее функция, тем она специфичнее, то есть тем меньше она имеет синонимов.

Понятие функционального острова связано с понятием целевого функционального пространства (рис.2), поэтому они обозначаются одним и тем же символом Of. Однако это не тождественные понятия. Целевое пространство есть множество паттернов, кодирующих f, и принадлежащих в общем случае к различным функциональным островам.

Функциональные острова могут сильно различаться по размеру. Это определяется тем, сколько существует близких по структуре синонимов белковых строк, обеспечивающих данную функцию. Размер функционального острова (или всего пространства поиска) можно пересчитать в битах.

Чем больше функциональная сложность фиксированного острова, тем меньше его относительный размер в пространстве поиска. Важно понять, что имеет значение не абсолютный размер острова функции, но его относительный размер в сравнении с размером пространства поиска. Покажем это на конкретных примерах.

Пример 1. Возьмём сильно консервативную и не слишком длинную строку, уже знакомый нам по предыдущим записям (uncommondescent.com) убиквитин. Длина: 76 AAs (то есть 76 аминокислот). Размер пространства поиска: 2076, что соответствует log22076 ≅ 329 битам. Здесь  и в других местах данной записки число 20 участвует потому, что в природе имеется 20 протеиногенных аминокислот. Таким образом, 20 - это размер нашего алфавита.

Конечно, даже убиквитин допускает вариации, но это один из самых консервативных примеров за всю историю биоты. Для простоты рассуждений допустим, что по крайней мере 70 AAs сильно консервативны и не допускают вариаций а оставшиеся 6 AAs неконсервативны и могут изменяться без ограничений (конечно, в реальности ситуация немного иная, но в целях дискуссии примем это как допущение).

Из расчёта максимального количества информации на аминокислоту, то есть log220 ≅ 4.32192 бита, получим:
  • Количество функциональной информации в консервативном участке строки: 70 * log220 ≅ 303 бита.
  • Количество функциональной информации в острове: 6 * log220 ≅ 26 бит.
Размер острова, соответствующий 6 * log220 битам, не так уж мал по абсолютной величине: это примерно 64.0 * 106 строк. Но даже такого размера остров исчезающе мал по сравнению с пространством в 329 бит, то есть по сравнению с примерно 1.1 * 1098 строк!

В случае более длинных строк отношение между островом и пространством ещё более проблематично для дарвинистов. Таким образом, с ростом функциональной сложности увеличиваются и статистические барьеры на пути эволюционного поиска.

Пример 2. Ещё один наш старый друг, бета-цепочка АТФ-синтазы (длина: 529 AAs), имеет 334 совпадения между бактерией Е. coli и человеком. Для простоты примем, что 300 AAs из них консервативны, а оставшиеся допускают замену на любую аминокислоту. Тогда получим:
  • Размер пространства поиска: 20529 ≅ 2286 бит.
  • Количество функциональной информации в строке ≅ 1297 бит.
  • Размер функционального острова (в пересчёте на биты): 2286 - 1297 = 989 бит.
  • Подсчитаем число Y строк, кодирующих функцию бета-цепи АТФ-синтазы. log2(Y) ≅ 989 бит. Если представить Y как 10x, то поскольку log2(10x) ≅ 989, x ≅ 989 / log210 ≅ 297.
10297 - гигантское число даже с учётом того, что в связи с упрощениями это оценка сверху и в реальности это число ниже. Но в этом случае функциональный остров в 10390 раз меньше размера пространства поиска, тогда как в примере убиквитина остров меньше пространства "всего лишь" в 1091 раз.

Другими словами, с возрастанием длины функциональной строки размер пространства поиска "взрывается" гораздо быстрее, чем размер функционального острова (целевого подпространства), разумеется, при условии возрастания размера консервативной подстроки.

Итак, бета-цепочка АТФ-синтазы находится в относительно намного меньшем острове, чем убиквитин.

Подробнее см.:Функциональная сложность

См. функциональная информация.

Целевое функциональное пространство

Целевое функциональное пространство Of является подпространством пространства П возможных паттернов. Каждый элемент Of реализует функцию f. Понятие целевого функционального пространства (рис.2) связано с понятием функционального острова, поэтому они обозначаются одним и тем же символом Of. Однако это не тождественные понятия. Целевое пространство есть множество паттернов, кодирующих f, и принадлежащих в общем случае к различным функциональным островам.

Целенаправленность

Характеристика деятельности агента по созданию паттерна. Ц. предполагает существование цели и стремления к ней, выражающегося в планировании шагов по её достижению и исполнению плана.

Литература
  1. Академический интернет-словарь: Абдукция.
  2. Записка: Пояснения gpuccio по поводу оценок количества функциональной информации.
  3. Записка: Для удобства выкладываю опять пару ссылок.
  4. Записка: Что такое сложная биофункция.
  5. Durston KK, Chiu DK, Abel DL, Trevors JT: Measuring the functional sequence complexity of proteins. Theor Biol Med Model 2007, 4:47, doi:  10.1186/1742-4682-4-47
  6. Hazen RM, Griffin PL, Carothers JM, Szostak JW: Functional information and the emergence of biocomplexity. Proc Natl Acad Sci U S A 2007, 104 Suppl 1:8574-­‐8581, doi: 10.1073/pnas.0701744104.
  7. GPuccio: Defending Intelligent Design theory: Why targets are real targets, probabilities real probabilities, and the Texas Sharp Shooter fallacy does not apply at all, uncommondescent.com.
  8. GPuccio: An attempt at computing dFSCI for English language, uncommondescent.com.
  9. GPuccio: Functional Information Defined (uncommondescent.com).
  10. GPuccio: Ответ на возражение об альтернативных состояниях.
  11. Szostak JW: Functional information: Molecular messages. Nature 2003, 423 (6941):689.
  12. Wikipedia: Bayes Factor.
  13. Wikipedia: Entropy (Information Theory).
  14. David L. Abel: The First Gene.

основные понятия, номенклатура

Previous post Next post
Up