Новый этап науки

Jan 03, 2025 15:39


Не про якута и не про датчан. :)

«Каждый раз, когда мы увольняем лингвиста, качество работы системы повышается» Фредерик Елинек, руководитель разработок по распознаванию речи в IBM.

ABBYY, одна из крупнейших языковых систем распознавания и перевода текстов, построенная на научной лингвистической модели признала свою неэффективность по сравнению с ИИ ( Read more... )

Мысли

Leave a comment

uhum_buheev January 4 2025, 00:30:03 UTC
Нелингвисты совершенно не осознают мощности языка как механизма, а именно, количества и степени сложности правил, которые надо соблюсти, чтобы получить правильный текст. Легкость, с которой человек производит устные и письменные тексты на родном языке, лишает его возможности поверить в истинные масштабы той информации, которой он при этом бессознательно оперирует (Зализняк). Уже в 80-х годах было понимание, что язык - возможно самая сложная система из известных, включая заумные физические теории. 60 или 80 тысяч правил, которые использовали ABBYY, вероятно на порядок или два меньше, чем нужно. К тому же - и это важный момент - язык (и многие правила) обычно меняются быстрее, чем лингвисты успевают их идентифицировать и протестировать.

Это, собственно, давно известно в области моделирования динамических систем - пока ты составляешь грандиозную и подробную модель, она устаревает.

Нейронки не убьют лингвистику, они ее обогатят.

Reply

john_jack January 4 2025, 15:43:06 UTC
Я бы возразил: "правильный текст" получить вообще невозможно, потому что любой достаточно *красивый* текст сам создаёт правила. Никакой информацией человек не оперирует, он складывает слова в крайне приблизительную конструкцию, и предсказуемо получает весьма расплывчатый результат. Где требуется результат чёткий, там всегда приходится вводить искусственные и прямо прописанные правила, естественному человеку противные (яркий пример - задачи на формальную логику). А десятки и сотни тысяч правил - это больше, чем в языке есть слов, яркое признание что никаких закономерностей нет и каждая отдельная конструкция ведёт себя по-своему ( ... )

Reply

jambojet January 4 2025, 23:35:09 UTC

А я сразу вспомнил "юридический" язык и канцелярит.

Reply

alexartukov January 6 2025, 05:14:22 UTC
> Вон выражения вроде "не может в" и "не только лишь все". Они нарушают правила, они поменяли язык

Это сленговые выражения. Приходят и уходят, чаще всего в конечном счёте не изменяя язык. Думаю, ваши два примера уйдут вместе с поколением.

Но бывает что и закрепляются, так блатной жаргон проник в русский язык.

Reply

john_jack January 6 2025, 20:19:10 UTC
Сленговые выражения не имеют смысла без контекста. Это же откровенно эрративы, вроде "ихний", но их значение однозначно и очевидно каждому. Может они и уйдут, а может и станут нормой, как "друшлак" и прочие селючизмы в официальном украинском языке. Или как поменяличь чорт, шкап и оффис.

Язык - живой. Он постоянно меняется по всяческим причинам. И если лингвисты пытаются этому помешать, у них получится лишь анус себе сформировать свой отдельный мертворожденный искусственно правильный язык

Reply


Leave a comment

Up