Про ёжика в тумане, зазнайство, языки программирования и вериги

Jun 01, 2016 12:49

ivan-gandhi нашёл очень поучительный пример, на котором любой может прикоснуться к новому волшебному миру, воспеваемому ailev.

Итак, задача простая: берём строчку «Gasthaus zur Bundesländern» и пытаемся первести на русский.

Советую взять яндекс как более умный. И очень рекомендую печатать руками, следя за превращениями в соседнем окне.

Слева стоит «Gasthaus» справа вполне сносный переовд.

Теперь по буквам вводим « zur» и смотрим что происходит с первым словом в переводе.

Ничего удивительного. Хоть, в Яндекс и введена грамматика, но сочетание «Gasthaus zur» относится к невозможным в стандартных правилах хохдойча и алгоритм сваливается на другую ветку.

Теперь добавим «Bundesländern». Опять же по буквам, потому что слово составное и алгоритм на ходу меняет предположение.

(«ä» можно записать как «ae»)

Но это ещё не всё.

Вернёмся к первоначальному состоянию и напечатаем
«Gasthaus "», начав название гостиницы с кавычек.

Алгоритм опять соскакивает на другую ветку, давая иной результат.

Наиболее близкий переод получается при введении строчки «Gasthaus "Zur Bundesländern"», превращающейся в «Гостевой Дом "На Землях"».

Прошу заметить, кроме общего хохдойча существуют множество диалектов, немного отличающихся по правописанию и грамматике. И это, как и выведенные на ходу авторами англицизмы, часто попадает во вполне литературные тексты.

Если перевести эмоции в словестную форму, статистические алгоритмы будут валится на граничных случаях. Причём валится так, что вытаскивать их оттуда смогут только специально обученные маги.

Маги потому, что правила, созданные в результате глубокого нейронального обучения, получаются чёрным ящиком с неизвестными побочными эффектами.

Так что, будут безводительные грузовики мчать из конца в конец Штатов днём и ночью, не останавливаясь, не уставая, ни сворачивая с пути. А в каждом, в удобном купе без руля и педалей, разместят оператора перезапуска, который при аварийной остановке на трассе будет открывать особую панель и жать на три заветные кнопки, давая одновременно через голосовое управления пару совершенно не имеющих смысла фраз, позволяющих умному автоматическому алгоритму выйти из ступора.

Если современный немецкий поезд ICE встал посреди дороги и машинист объявил о небольших технических проблемах, не удивляйтесь. Там, в самой голове поезда, человек устал бороться с софтверными ошибками простыми способами, нажал на кнопку «Reset» и ждёт, когда система поднимится, придёт в рабочее состояние и, может быть, забудет о прозошедшем сбое.

И это простейший алгоритм, проверенный квалифицированными специалистами, прекрасно видящими его внутренности. С тёмными результатами статистического обучения на неизвестных примерах поможет только настоящая магия.

Можно, конечно, начать рассказывать про то, что, когда компьютеры придут к власти, всех заставят писать правильно и переходить дорого строго на зелёный. Ни в первый раз человечество подстраивается под дурацкие интерфейсы.

Однако, грамотность как раз падает и алгоритмы семантического анализа будут всё чаще натыкаться на слова, исправленные автокорректорами с неправильных на не подходящие по смыслу.

Нас ждёт интересное будущее.

semantics, trends, ru, de, quality, marketing

Previous post Next post
Up