Лингвистический преобразователь. Синтаксический уровень языка

Jun 09, 2012 23:01

Синтаксический уровень языка - ПСД, элементами которой являются синтаксические деревья. Каждое дерево представляет собой цельную смысловую единицу высказывания. В тексте синтаксическое дерево обычно соответствует простому предложению или части сложного предложения. Поэтому элементы данного уровня мы будем также именовать предложениями. Таким образом, мы имеем первый языковой уровень со сложной внутренней структурой.

Возможно двоякое представление синтаксического уровня - в виде грамматики непосредственно составляющих и в виде деревьев зависимостей. Мы будем использовать второй вариант. Я сейчас не буду глубоко вдаваться в особенности первого представления, вы можете прочитать про него самостоятельно. Скажу лишь, что оно подходит для английского языка, но не годится для русского (пример - "Умный у тебя сын растёт.")

Узлами дерева зависимостей являются слова языка. На данном уровне нас не интересуют формы слов и их изменяемые атрибуты: эта информация используется лишь при построении более простых уровней высказывания. На первый план здесь выходят роли слов и отношения между ними.

Корнем синтаксического дерева является искусственный узел "#". Ему подчинён главный узел предложения (сказуемое, если оно есть). Ему - те слова, которые непосредственно зависят от него синтаксически. И т.д.

К примеру, предложение "Каждый день Вася ходит в школу." на синтаксическом уровне будет представлено как "#(ходить(Вася, день(каждый), в(школа)))" - морфологическая информация и роли в данном представлении опущены. Роли соответствуют членам предложения в лингвистике, но могут быть уточнены и расширены.

Тут пришлось задуматься: что представляет собой словарь для синтаксического уровня? Вроде как он должен состоять из элементов ПСД. Но эти элементы - предложения, а их количество неограниченно велико. Такой словарь неудобен в использовании.

На словарь можно посмотреть и с другой стороны. Как указано в предыдущем тексте, словарь - это таблица индексов, из ссылок на которую можно собрать полноценное сообщение на данном языковом уровне. На синтаксическом уровне для построения сообщения нам необходимо знать слова, соотношения между ними и роли, приписанные этим соотношениям. Сами слова хранятся в морфологическом словаре. Таким образом, нам нужно лишь хранить атрибутированные соотношения. А это означает, что синтаксический словарь - это словарь словосочетаний. Именно словосочетания отображают возможные связи между словами и различные виды подчинения слов (управление, согласование, примыкание). Словарь связывает слова из морфологического словаря (указывая их индексы) и добавляет возможную связь между ними.

Ну, по крайней мере в настоящий момент мне это видится так.

ИИ

Previous post Next post
Up