планы на v.12

Dec 22, 2012 15:22

1. Реализовать принцип кратчайшего связывания - при наличии нескольких вариантов построения дерева выбирать при прочих равных условиях те варианты, в которых расстояния между узлами в одном ребре минимальные. То есть для

смотрю фильм о том, что пираты делали на острове

вариант связывания “смотрю …. на острове” подавляется в пользу “... делали на острове”

2. Продуктивные и не продуктивные части речи (классы): задавать и хранить признак в объявлениях частей речи, учитывать при генерации вероятностных правил распознавания. Цель - не пытаться при распознавании несловарных лексем пытаться сопоставить их с предлогами, союзами, частицами.

3. Подключить декодер вероятностной модели в грамматическом движке. Управление вероятностной моделью в sol_MorphologyAnalysis и sol_SyntaxAnalysis через битовые флаги - не использовать, использовать как вспомогательную, использовать как основную.

4. Доработка и испытания второго варианта нисходящего парсера, работающего по шаблонами с ключевыми словами.

5. Утилита PARSER - статистическая обработка текста с синтаксическим разбором; определение темы документа, основных действующих лиц, места, времени, совершаемых действий.

текущие планы, грамматический словарь

Previous post Next post
Up