Об изучении языка

Nov 07, 2024 11:49


Умный человек подкинул статью про крах компании ABBYY.
Букафф многа, открывается ссылка через раз, поэтому коротко своими словами.
Компания вложила огромное количество сил и средств в разработку Универсального Переводчика, основанного на Правилах. Он должен был преобразовывать тексты в Единую Семантическую Модель, а потом из Модели - в текст на другом языке в соответствии с грамматикой и семантикой оного.
Система распознавания текста FineReader давала достаточную прибыль, чтобы финансировать сотни дипломированных лингвистов, которые потратили миллионы человеко-часов на разработку Модели. К 2010 году компания добилась впечатляющих успехов и уже готова была покорить мир, но тут на сцене появился Google Translate.
В отличие от ABBYY, Google не встраивал в свой продукт никаких правил. Чистая статистика: вот текст на одном языке, вот его перевод на другой язык, на, машина, разбирайся, что во что превратилось. Никакой лингвистики. (Примечание: описание алгоритма о-очень упрощённое, но для пояснения основной мысли вполне достаточное).
Подход Google хорош ещё и тем, что для улучшения качества перевода не требует работы высококвалифицированных учёных - только машинное время, которого у Google в избытке. В общем-то, именно это и привело к краху ABBYY: поток денег от FineReader стал не таким полноводным, как в начале, а Большая Идея себя исчерпала. Вот и уволили всех разработчиков, оставив только немного продавцов да имя, покрытое потускневшей славой...
С одной стороны, обидно за фундаментальную науку. Жаль, что тупая железяка (хотя на самом деле не такая уж и «тупая») выдала практический результат лучшего качества.
Но с другой стороны, именно эта разница подходов и отличает знание родного языка от знания иностранных языков. Я, например, едва ли знаю десяток правил русского языка, и то они в основном относятся к пунктуации. Это, однако, не мешает мне сравнительно грамотно писать - исключительно на основании набранной бигдаты статистики. А иностранные языки - это правила, правила и правила. Конечно, так можно выучить язык гораздо быстрее, но полноценно освоить его не получится. Только статистика, только большие данные...

английский язык, перевод, русский язык

Previous post Next post
Up