Русские модели морфологии и синтаксиса для парсера пересчитаны после обновлений в лексиконе и обучающем корпусе.
Русская словарная база (лексикон) тщательно вычищена, из нее убраны "плохие" словарные статьи, в основном для составных слов типа "робот-гитарист".
Сделана выверка части обучающего treebank, на котором тренируются вероятностные модели. В
(
Read more... )