Манускрипт Войнича

Jun 18, 2012 13:56

Манускрипт Войнича - это самая загадочная книга в мире. Все ее 234 страницы исписаны непонятными словами, составленными из загадочных букв, изрисованы изображениями не существующих на Земле растений, звездными картами и голыми женщинами, которые у нас тоже не водятся. О попытках ученых понять, о чем повествует рукопись.



С ума можно сойти, - говорит Жак Ги, французский лингвист-пенсионер, который изучает манускрипт более десяти лет. - Некоторые люди имеют наглость утверждать, что близки к разгадке». Ги - один из энтузиастов, которые не сдаются, вооружившись компьютерами и плодотворными идеями. Исследователи в поисках ключа к шифру пробуют даже использовать статистические методы, заимствованные из проекта «Геном человека». И говорят, что вот-вот что-нибудь прочтут. По крайней мере, они убедились, что текст манускрипта не полная ахинея, а в самом деле осмысленный текст, только непонятный. Значит, есть шанс когда-нибудь его понять.
В 1912 году американский коллекционер Уилфрид М. Войнич обнаружил эту странную книгу на вилле Мондрагоне в итальянском городе Фраскати. Между страницами лежало письмо, датируемое 1665 или 1666 годом, от ректора Пражского университета. Он просил одного известного ученого поучаствовать в разгадке шифра. Судя по тексту послания, Священный римский император Рудольф II Богемский, правивший с 1576 по 1612 год, купил манускрипт за 600 дукатов. На вес это будет три с половиной килограмма золота. В послании также был намек на то, что автором каракулей мог быть Роджер Бэкон, францисканский монах и мистик XIII века, который интересовался наукой и криптографией. А мог и не быть. В настоящее время книга хранится в Библиотеке редких книг и манускриптов Бейнеке (Beinecke Rare Book and Manuscript Library) при Йельском университете.

Манускрипт Войнича - небольшая по формату, но довольно толстая книга, совсем не похожая на древние роскошные фолианты. В ней много иллюстраций, но выглядят они будто бы нарисованными примитивистом или двенадцатилетним подростком. Изображено много цветов и растений, совершенно не похожих на те, которые встречаются в природе. Хотя некоторые экземпляры отдаленно напоминают перец и подсолнухи. В разделе, который условно можно отнести к биологии, нарисованы упитанные голые женщины, или «нимфы», как их называют исследователи-энтузиасты. Они небольшого роста и неказисты, с круглыми животами и маленькими заостренными грудями. Женщины принимают ванны с зеленой водой. Она поступает по трубам, напоминающим фаллопиевы и артерии. А еще в книге есть астрологические схемы, зодиакальные круги и карта неба с изображением звездного скопления, напоминающего туманность Андромеды. Бумага в книге очень дешевая. В те времена в такую заворачивали рыбу.

Иллюстрации снабжены текстом, как бы объясняющим их. Вот только понять объяснение не представляется возможным. Знаки выглядят до боли знакомыми: одни похожи на латинские буквы и аббревиатуры, другие - на арабские цифры. Начало каждой строки украшают тщательно вырисованные «виселицы», а в конце многих слов стоит загадочная закорючка, похожая на цифру девять.
Войнич привез документ в США и предложил криптографам попробовать его расшифровать. В 1919 году некто Уильям Ньюбопд из Университета штата Пенсильвания заявил, что прочел текст, который, по его мнению, был копией лабораторных заметок Бэкона. Из перевода Ньюболда выходило, что Бэкон проводил исследования с помощью телескопов и микроскопов, которых в XIII веке еще не было. То есть одна загадка породила другую. И в итоге оппоненты сумели доказать, что Ньюболд ничего толком не перевел, - так, нафантазировал. Он умер от переживаний, но свое поражение не признал.

После Ньюболда множество профессиональных криптографов и просто «чайников» утверждали, что им удалось расшифровать манускрипт. Но все толкования страдали одним и тем же недостатком: предложенные «ключи к шифру» не подходили сразу ко всем разделам документа. Некоторые исследователи видят причину трудностей в том, что манускрипт зашифрован на разных языках. И кое-где автор, например, использовал... украинский язык, который скуден на гласные.
В 1960-е и 1970-е годы за текст брались эксперты Агентства национальной безопасности США. Они преобразовали слова в машиночитаемую форму и провели ряд статистических исследований, попробовав найти в манускрипте скрытые «следы» каких-нибудь языков. Но ничего не получилось.
В конце 1970-х годов филолог из Йелького университета Роберт Брумбау заявил, что понял, в чем тут фокус. Все просто: книгу написали для того, чтобы потрясти Рудольфа II некими тайными знаниями и подороже их продать. Изначально лишь малая часть документа подлежала прочтению, говорит Брумбау. И это должно было показать, что книга подлинная. А дальше шарлатаны дополнили ее полной околесицей. Так что гипотеза о подлоге и сейчас довольно популярна. Но столь приземленно мыслят далеко не все исследователи. К примеру, Габриэль Ланди-ни из Бирмингемского университета говорит, что «такой подход крайне непродуктивен».
Чтобы прочесть манускрипт Войнича, нужно либо расколоть шифр, либо найти «шифр-блокнот» - своего рода словарь, в котором каждому слову текста имеется эквивалент на английском, латыни или другом языке. Если манускрипт действительно закодирован с помощью шифр-блокнота, то прочитать текст, скорее всего, не удастся вообще. Если только этот блокнот, замусоленный и изорванный, вдруг кто-нибудь не найдет.
Дело пойдет лучше, если окажется, что книга написана с использованием шифра, то есть алгоритма для замены букв условными символами. В XV-XVI веках шифры были не особенно сложными. Большинство из них предусматривали элементарную замену буквы алфавита неким знаком. Такой шифр расколоть легко. Чтобы установить соответствия, сначала составляют частотную таблицу символов зашифрованного текста, а затем сопоставляют периодичность их повторения в исходном языке.

Гораздо труднее разобраться с шифром, в котором одной и той же букве соответствуют несколько символов. Леон Батиста Альберти обнародовал подобную методику в 1460-х годах, поэтому манускрипт мог быть закодирован именно так, если он, конечно, относится к более позднему периоду. Расколоть многоалфавитный шифр гораздо сложнее, но тоже можно, сопоставляя последовательности букв.
Но как сопоставить частотность букв, если неизвестно, на каком языке написан текст? Задачу осложняет и то, что исследователи не могут разобраться и с самим алфавитом книги. Проблемы возникают, даже если основа рукописного текста английская. Например, две идущие подряд буквы е, написанные курсивом, могут быть похожи на курсивную и. В разукрашенном тексте Войнича сливаются многие буквы. Возможно, буквы в виде виселицы просто обозначают абзацы. Быть может, каждое слово означает одну букву. А промежутки между словами могут быть расставлены произвольно - чтобы сбить читателя с толку.

Задача выглядит безнадежной. Но не настолько, чтобы ее бросить. Например, исследователи определили, что в манускрипте примерно 250 тысяч слов, из них около 40 тысяч - разных. «Букв» там то ли 23, то ли 30, причем ни одна из них не обозначает число. Похоже, что документ написан слева направо. В словах в среднем по шесть букв. То есть в среднем они короче, чем в английском, латинском и большинстве индоевропейских языков. Слова часто повторяются. Можно встретить до четырех последовательных повторов одного слова. Есть и цепочки слов, отличающихся лишь одним символом.
Вот уже десять лет существует клуб электронной почты, члены которого делятся друг с другом своими соображениями и догадками по поводу содержания манускрипта. В том числе люди работают и над статистическими методами анализа. Несмотря на все свои странности, документ содержит определенные статистические свойства, которые характерны для реальных языков. Поэтому манускрипт вряд ли можно отнести к проделкам сумасшедшего или банальной подделке.
Один из способов работы с тайным документом - изучение его энтропии. Или анализ того, насколько плотно «упакована» информация в знаках или словах. Язык с высоким уровнем энтропии отличается разнообразием в порядке букв, слов или их сочетанием. Энтропия бывает разных видов. Один из простейших подходов заключается в том, чтобы рассчитать, с какой вероятностью за одной буквой, взятой для анализа, следует другая. Например мы знаем, что в английском за буквой g чаще всего идет буква u . Таким образом, уровень неопределенности здесь крайне низок. Соответственно низка и энтропия этой самой буквы.

В 1976 году физик Йельского университета Уильям Беннет обнаружил, что уровень энтропии в языке книги значительно ниже, чем в латыни, английском или любом другом европейском языке. Языки с низким уровнем энтропии встречаются в Полинезии. Но вряд ли в эпоху Возрождения по Италии свободно разгуливали выходцы с Гавайских островов. Низкий уровень энтропии исключает применение многоалфавитного шифра, поскольку в этом случае уровень был бы намного выше. Хотя бывают и шифры, которые снижают уровень энтропии. Все это наводит на мысль, что манускрипт вполне мог быть составлен с помощью шифр-блокнота либо написан на искусственном языке.
Замысловатую теорию выдвинул несколько лет назад Хорхе Столфи, специалист по компьютерной графике из Университета Кампинас в Бразилии. Проанализировав текст посредством компьютерной программы, он якобы обнаружил, что определенные символы располагаются лишь в определенных частях слова и служат префиксами, корнями и суффиксами. Ученый предположил, что в основе манускрипта - какой-то китайский диалект и записан он со слуха китайцами, которые сопровождали итальянских путешественников в их экспедициях. Китайские слова односложны, причем каждое состоит из трех фонетических компонентов. Префикс может отображать тональность слова, корень - согласный звук, а суффикс - гласный. Столфи даже поспорил на пиццу с другими толкователями книги о том, что его китайская теория правильная. Но потом пошел на попятную. Мол, сам признаю, что ошибаюсь. «Я честно хотел купить Ландини пиццу, а он отказывается. Говорит, что моя теория имеет право на существование до тех пор, пока документ не будет расшифрован», - смеется бразилец.
От китайской грамоты Столфи отказался после того, как усовершенствовал свою компьютерную модель и опубликовал еще один анализ, в котором выделил «кору, мантию и ядро» слов. Такая жесткая структура указывает на то, что мы, возможно, имеем дело не со словами, а с цифрами. Многие цифровые системы устанавливают определенные рамки для последовательности разнообразных символов. Например, шестизначная римская цифра будет, скорее всего, начинаться с М, D или С, а заканчиваться на I, V или X. Так не является ли манускрипт Войнича набором цифр? То, что они все примерно одной длины, указывает на очередной уровень сложности. А для перевода цифр в слова необходима книга с ключами.
Другие исследователи продолжают разрабатывать теорию о том, что манускрипт можно расшифровать и без другой книги.
Новые изыскания показывают, что уровень его энтропии не такой низкий, как предполагалось ранее. Рене Зандберген, системный аналитик из германского Дармштадта, обнаружил, что первый и второй знаки действительно имеют низкий уровень энтропии. А вот третий и последующие символы несут больше информации. Это означает, что все же существует вероятность того, что документ зашифрован с использованием аоабского или другого языка восточного происхождения.
Ландини применил к тексту метод под названием спектральный анализ. Эту технологию обычно применяют для обнаружения последовательностей в нестабильных цепочках информации, таких, как основания ДНК и музыкальные произведения. Вероятность выявления символа, повторяющегося через определенный интервал, например, через восемь букв, наносят на период. Для случайных входных сигналов, таких, как белые шумы, спектральная функция будет выглядеть прямой линией. Но для сигналов, обладающих какой-либо структурой, спектральная функция будет отличаться от прямой линии.
Ландини опубликовал результаты своего исследования в журнале Cryptologia. Анализ показал, что последовательности в манускрипте Войнича совпадают с последовательностями настоящих языков. К примеру, налицо был естественный период длиной 5,9 символа. А это совпадает со средней длиной слов в документе. Похоже, что пробелы действительно разделяют настоящие слова, а не вставлены произвольно, чтобы сбить с толку читателя.
Что же делать дальше? Возможно, на настоящий момент надо прежде всего получить достоверные данные, с которыми могли бы работать статистики. Микрофильмированную версию книги, которую можно купить в Йельском университете за 40 долларов, читать сложно. На ней видны только отдельные буквы. Поэтому энтузиасты работают над созданием четкой цифровой копии. Зандберген и Ландини собрали транскрипты, созданные за все эти годы Агенством национальной безопасности и другими организациями. Они тщательно изучают каждую копию, чтобы найти разночтения и потом сделать одну четкую версию. Ученые хотят уговорить Библиотеку Бейнеке выпустить манускрипт в цветном виде на компакт-диске. «Для манускрипта Войнича это будет сродни проекту по изучению генома человека, - говорит Ландини. - Как только мы получим полную версию, то сможем повторить все исследования, используя исходные данные более высокого качества».

Немалую роль будут по-прежнему играть удача и вдохновение, полагает Джим Риде, профессиональный криптоаналитик из лаборатории компании AT&T в Флорэм-Парк, штат Нью-Джерси. Он прославился тем, что расшифровал другой документ XV века - книгу Иоганна Тритемиуса, немецкого аббата и известного криптографа. «Суперкомпьютеры не взламывают коды сами по себе. Нужны люди, которые в состоянии направить их по правильному пути», - говорит Ридз. Однако Жак Ги жалуется, что устал от этой гонки, хотя он и не прекращает размещать в своем электронном клубе новые материалы. «Манускрипт Войнича - лакмусовая бумажка, способная проверить уровень нашего лингвистического знания, - говорит он. - И результаты этой проверки неутешительны». Ги подумывает о том, чтобы поменять хобби. На нечто, способное дать результат. Например, можно заняться расшифровкой табличек с острова Пасхи. «Уж они-то точно настоящие».

языкознание, это интересно

Previous post Next post
Up