Искусственный интеллект, возможно, расшифровал таинственный Манускрипт Войнича2
Многие века этот манускрипт оставался тайной, которую человек не мог разгадать, но появилась надежда, что наконец-то мы сможем его прочесть, — и всё благодаря машинам, которые на 500 с лишним лет моложе этой книги.
Манускрипт Войнича, который часто называют самой таинственной книгой в мире, состоит из 240 страниц тайного текста, написанного на неизвестном замысловатом языке, дополненного странными диаграммами и иллюстрациями. Тут даже есть раскладывающиеся страницы, что довольно неожиданно для средневекового тома, датированного началом 15-го века.
Дело в том, что никто не знает, в чем смысл этой книги. Значение этого текста, аккуратно выведенного на страницах старинного пергамента, ускользает от человеческого понимания уже многие века.
Манускрипт ходил по рукам алхимиков и императоров, пока не вышел в свет в начале 20-го века, когда в 1912-м году на него наткнулся польский библиофил и антиквар по имени Михаил-Вильфред Войнич, невольно подарив таинственной книге свою фамилию.
С тех пор бесчисленное множество криптографов, дешифровщиков и лингвистов пытались раскрыть секреты манускрипта Войнича, но неясный код, хранящися на его страницах, а также странные рисунки растений, символов и купающихся женщин, так и остались без объяснения.
И вот, благодаря специалистам по теории вычислительных систем из Канады, возможно, удалось найти новую зацепку.
Исследователи из Альбертского университета использовали исскуственный интелект, чтобы расшифровать части древнего манускрипта. Техника, которой они воспользовались, называется алгоритмическое дешифрование, и она помогла им найти лежащий в основе зашифрованный язык, скрытый за странными словами книги.
Это не так то просто, обяснили они в своей статье, ведь задействованно очень много неизвестных.
“Манускрипт Войнича написан неизвестными буквами, шифрующими неизвестный язык,” — пишут авторы, — “а это самый сложный тип задачи дешифрования.”
Алгоритм протестировали на 380 различных переводах Всеобщей декларации прав человека, и система, созданная исследователями, сумела верно определить язык оригинала в 97% случаев.
Затем они направили ИИ на страницы манускрипта Войнича, который по предположениям команды написан на арабском. ИИ с ними не согласился, определив иврит как самый вероятный источник, тем самым вытеснив другие потенциальные языки, которые не слишком широко использовались для письма в Средние века.
Исследователи выдвинули гипотезу, что шифр, основанный на иврите может быть примером алфавитно упорядоченных анаграмм (называемых альфаграммами), в которых меняется порядок букв в словах и пропускаются гласные.
Но попытка расшифровать первые 10 страниц текста с помощью ИИ привела к неоднозначным результатам.
“Оказалось, что больше 80% полученных слов были в словаре иврита, но мы не знали, есть ли смысл в самом тексте,” — рассказывает один из членов команды компьютерный лингвист Грег Кондрак.
Так как команде не удалось найти знатоков иврита, чтобы проверить свои результаты, они в итоге обратились к Google Translate, и хотя они признают, что в некоторых местах пришлось делать предположения, все же удалось найти соотвествие тексту.
В начале главы “Травы” манускрипта Войнича, где содержатся рисунки различных растений, можно найти много терминов, связанных с ботаникой, такие как земледелец, свет, воздух и огонь.
Совпадение? Возможно и нет.
С каких же слов начинается самая таинственная с мире книга? Что ж, довольно неоднозначно, но что еще можно было ожидать?
“Она дала рекомендации священнику, мужчине дома и мне и людям,” — первое предложение манускрипта Войнича, если верить ИИ.
Рекомендации, связанные с ботаникой, возможно? Исследователи говорят, что нельзя сказать точно.
“Получилось грамматически верное предложение, и его можно интерпретировать,” — говорит Кондрак. — “Это, конечно, странное начало рукописи, но в нем есть смысл.”
С учетом всего вышесказанного, команда признает, что им понадобится помощь историков, знающих иврит, чтобы продолжить расшифровку, и подтвердить, что выведенный алгоритмом результат не является неправильным толкованием тайны Войнича.
“Результаты, полученные в этой части можно считать как соблазнительной подсказкой, что иврит и является языком источника [манускрипта Войнича], так и просто артефактами комбинаторной силы анаграмм и языковых моделей,” — пишут они.
“В любом случае, получение результата при алгоритмическом дешифровании крайне искаженных данных может стать отправной точкой для ученых, которые хорошо знакомы с данным языком и историческим периодом.”
С учетом того, что многое нам все еще неизвестно, это отличная зацепка для дальнейших попыток расшифрования древней загадки, но не все в сообществе дешифровальщиков Войнича доверяют подходу команды, завязанному на искуственном интеллекте.
“Не думаю, что они хорошо относятся к такому типу исследований,” — рассказал Кондрак, но он отметил, что существует реальная возможность для дальнейших открытий, если гипотеза об иврите является верной.
“Кто-то с хорошим знанием иврита ди при этом будучи историком может взять эти доказательства и последовать подсказке. Может, присмотреться к этим текстам и побыть немного детективом, и тогда удастся расшифровать послание?”