1. Реализовать принцип кратчайшего связывания - при наличии нескольких вариантов построения дерева выбирать при прочих равных условиях те варианты, в которых расстояния между узлами в одном ребре минимальные. То есть для
смотрю фильм о том, что пираты делали на острове
вариант связывания “смотрю …. на острове” подавляется в пользу “... делали на острове”
2. Продуктивные и не продуктивные части речи (классы): задавать и хранить признак в объявлениях
частей речи, учитывать при генерации вероятностных правил распознавания. Цель - не пытаться при распознавании несловарных лексем пытаться сопоставить их с предлогами, союзами, частицами.
3. Подключить декодер вероятностной модели в грамматическом движке. Управление вероятностной моделью в
sol_MorphologyAnalysis и
sol_SyntaxAnalysis через битовые флаги - не использовать, использовать как вспомогательную, использовать как основную.
4. Доработка и испытания второго варианта нисходящего парсера, работающего по шаблонами с ключевыми словами.
5. Утилита PARSER - статистическая обработка текста с синтаксическим разбором; определение темы документа, основных действующих лиц, места, времени, совершаемых действий.