Сколько информации содержит молекула ДНК, состоящая из 10 нуклеотидов? Большинство из вас, вероятно, ответит, воспользовавшись формулой Шеннона h(E) = -log2P{E}: 20 бит. Но я думаю, этот ответ неверен, и вот почему.
(
Стремленье смиренное лишь здесь исполняется )
Comments 132
Reply
Меня смущает не это, а разговоры о том, что, дескать, такой-то физический объект "содержит столько-то бит информации". Мне кажется, подобные утверждения начисто лишены смысла. А Вы что думаете?
Reply
Reply
Амперы или там джоули - это все тоже абстракции; тем не менее, силу тока и энергию всегда можно однозначно измерить и/или рассчитать. А информацию?
Reply
Reply
Reply
Reply
Меня занимают не значения слова "информация", а ее количественное выражение. Мой вопрос: применимо ли определение количества информации, введенное Шенноном, не только к последовательностям символов, но и к физическим телам?
Reply
Reply
Reply
Последовательность символов - это все таки не физический обьект. Это абстрактное понятие.
"Верно, но, заметьте, это ведь ответ на вопрос, обратный тому, какой я задала в посте"
Я демонстрирую в примере то что на вопрос "сколько информации содержит молекула ДНК, состоящая из 10 нуклеотидов" нужно отвечать, зная еще и аппарат. Можно спросить "сколько информации сможет записать синтезатор в ДНК из 10 нуклеотидов"
" Мне кажется, все это начисто лишено смысла, или нет?"
Э... это зависит более конкретно от того, что автор имеет ввиду. Например, если мы примем модель вселенной как клеточного автомата, то можно. Можно посчитать общее количество клеток во вселенной и умножить на количество возможных состояний каждой клетки.... Принципиально уточнять, что имеется ввиду. Но вообщем, согласен что заявление "такой-то физический объект содержит столько-то информации" бессмысленно.
Reply
Да, я именно это и хочу сказать: похоже, говорить о том, что нечто "содержит столько-то информации" можно только в случае последовательности символов, а не физических тел.
"заявление "такой-то физический объект содержит столько-то информации" бессмысленно"
А между тем, мне все чаще попадаются рассуждения о том, что, дескать, "все состоит из информации" - то есть, если мы будем копать все глубже и глубже, дробить все мельче и мельче, в конечном счете упремся в "голую информацию". Этот взгляд не укладывается у меня в голове.
Reply
Как во всякой формуле, сначала надо более-менее понять, к чему она относится. (Например, формула 2+2=4 не всегда является верной, как показал в своей диссертации Менделеев, 2 литра воды + 2 литра спирта = 3,86 литров напитка.) Так и здесь. Говоря о информации, Шеннон начинает со следующего:
Система связи по существу состоит из пяти частей:
Источник информации - создает сообщение
Передатчик - перерабатывает в некий сигнал
Канал передачи
Приемник - восстанавливает сообщение по сигналу
Адресат.
Reply
Reply
Reply
В этом случае никаких вопросов не возникает, поскольку мы опять же говорим не о физических объектах, а о последовательностях символов. Мне кажется, можно говорить "информационном содержании" только описаний, но не самих физических объектов. А?
Reply
Это не обязательно так. Для иллюстрации правильнее рассматривать белки, потому что у ДНК структура вообще простая. "Последовательное" информационное содержание белка из 100 аминокислот - 600 бит. Теоретически возможное число конформаций такого белка в приближении Левинталя (3 стабильные конформации на торсионный угол) - 3^198 (мы знаем, что это число на десятки порядков больше реального пространства конформационного поиска, см. парадокс Левинталя). И вот это вот сильно завышенное "структурное" информационное содержание - log2(3^198)=314 бит - прекрасно вписывается в наши 600 бит из последовательности.
Важно иметь ввиду, что такие расчеты предполагают доступность полного структурного "алфавита". Построить белок ab initio обойдется немножко дороже, чем 314 бит ;)
Reply
Вот именно. То есть, эти 314 бит нужны будут нужны в дополнение к 600 (да и то, 600 - это какой-то уж очень коротенький белок). Не говоря уже о том, что тут мы решаем обратную задачу - подсчитываем, сколько информации нам будет нужно, чтобы построить заданный белок. А эта задача предполагает предварительную договоренность о том, как именно мы будем расшифровывать заданную нам информацию, что, очевидно, тоже имеет свое информационное содержание. Вопрос же об информационном содержании физического тела остается неопределенным.
Reply
Leave a comment