Текущие результаты по обучению модели part-of-speech tagger'а: kelijah

kelijah

Текущие результаты по обучению модели part-of-speech tagger'а

Aug 07, 2015 12:42

На отметке 130,000 предложений в обучающем корпусе новая модель достигла ошибаемости в 0.91%. Это лучше ожиданий :)
В принципе, ошибаемость по мере роста числа предложений в корпусе колеблется в диапазоне 0.90...0.95%.

part-of-speech tagging, вероятностная русская морфология, вероятностная модель, machine learning, частеречная разметка