Я немного расширил набор фич в модели синтаксического парсинга и сделал предварительный grid search по метапараметрам.
Пока по предварительным замерами на валидации старая модель давет точность определения родителя примерно 96.83%, а новая модель дает минимум 98.54%.
Файлы новой русской синтаксической модели (предварительные) выложены в репозиторий:
syntax.codebook и
syntax.model.
После того, как сработает early stopping в
тренере модели я планирую погонять финальную версию на текстах и затем выложить дистр на
сайте.