баг в татарском языке

Dec 31, 2019 09:37

Вот моя тестировщицкая сущность дошла до corner case в языкознании. Когда найден баг спецификации (а для построения функции на основании биг даты дата не особенно то и биг).

Есть такая штука, которая называется понудительный залог. Самая мозговзрывающая в частности русскоязычным, когда глагол, кроме, например, очень логичных залогов возвратного и страдательного (аналог -ся, только логичнее еще, с разделением на "быть делаемым" и "быть делаемым самому себе"), кроме логичного совместного, который цепляется кстати легко и поверх первых двух (и вообще цепочки суффиксов там могут огого). Понудительный залог многих глаголов вообще говоря как-то плохо воспринимается как часть изначального, как правило в голове глагол начинает жить какой-то отдельной жизнью, например, "водить" "йөртү" от "ездить" "йөрү", или самый яркий "любить" "ярату" от "ярау" "быть годным", что никто уже и не сообразит о их связи. Вообще, т.к. понудительные аффиксы в разных глаголах-то разные, то тут слово явно надо знать, а не строить аналитические конструкции, как например в конструкциях изъявления желания или обозначения возможности "барасым килә" или "килә алам", которые не превратились в отдельные глаголы отдельного типа залогов только из-за консерватизма языка и слишком ранней формализации грамматики, а в каких-то тюркских языках, вроде крымскотатарского - успели превратиться. Вообще взрывает мозг, что эти категории составные, а понуждение - отдельный глагол, в котором еще разобраться надо. Не так-то легко понудить татарина. А требование знать заранее слово правильно, а еще совпадающие с глаголами в понудительном залоге идиомы совсем иного значения, чтобы не дай бог не употребить их неверно. А т.к. в живой устной и письменной речи понуждением тебя занимаются мало, понуждением других при тебе еще меньше, то по принципу того, как работает мозг или модель с глубоким обущением, выучить правильно с минимумом ресурсов их сложновато, объема данных не хватает. Это одна из самых сложных частей татарского языка вообще, возможно даже причина того, что в городском суржике часто говорят "русский глагол + итү", т.к. очень маленькая вероятность с детства услышать в нужном количестве эти конструкции находясь в какойнть всего на треть татароязычной среде.

Так вот, и тут есть, что называется, баг спецификации. Я на него напоролся по сути спустя пару десятков лет после того, как думал, что все знаю )

Вот есть базовый в настоящий момент глагол "оныту", забывать. Отрицательная форма, "не забывай" - "онытма". Его понудительный залог - "оныттыру", заставь забыть. Как думаете, как переводится "оныттырма"? "Не заставь забыть"? Ну так требует логика, да вроде? А хрен вам. "Оныттырма" это "не дай забыть". Понуждение к отрицанию от действия. В татарском это не осознается явно, тк. "оныттырма" это идиома "напомни", но фактически, "не дай забыть".

И вот встает вопрос, а как же сказать "не заставляй забывать"? Радиф засомневался под этим вопросом. Возможно, говорит, "оныттырырма". Но это не точно.

Если бы я составлял спецификацию на аналитический язык, я бы засунул возможность встыкивания аффикса отрицания до понудительного аффикса, что-то вроде "онытматыру", "оныттыру" и "оныттырмау", "онытматырмау". Но живой язык все упростил в тех уголках своей спецификации, куда заходит сам редко. Впрочем, с русским куда чаще случается ситуаций, куда при допуске грамматики мы не можем сказать определенным образом при помощи например определенного глагола, используя вместо одного слова целое предложение.

Вот такое вот интересное наблюдение. Естественно, что с такими мало покрытыми реальными языковыми ситуациями на письме дебрями грамматики забукусют и переводчики на основаннии моделей глубокого самообучения, например http://translate.tatar

Он практически не умеет делать так, чтобы понудительное предложение на русском языке при переводе на татарском дало понудительный залог в глаголе. А уж учитывая всякие грамматические конструкции, которые в современном мире не актуальны вроде "своими глазами видел- не видел". Вот диктор не телевидении, рассказывая о новости, которая точно была, но он сам диктор, не видел, должен рассказывать в какой грамматической категории, что видел или нет? И так категория "видел-не видел" должна переродиться в "доверяю- не доверяю", более общую.

мысли, инет, язык

Previous post Next post
Up