Кроме качества определения частей речи и тегов, у POS Tagger'ов с точки зрения использования во многих реальных проектах есть вторая важная характеристика - скорость. Иногда соображения компромисса вынуждают смириться с некоторой потерей качества ради выигрыша по времени обработки. В конце концов, есть большая разница между 8 и 2 часами на
(
Read more... )
Comments 2
Ну или наоборот "легкие к ошибкам" типы предложений выделить и кормить тем парсерам которые меньше ошибаются?
Reply
Такая солянка, или говоря умно "ансамбль" :), тяжеловато тащить куда-то в продакшн.
Только в ресече на некоторых задачах.
Я так улучшал качество разметки, соотнося результаты двух pos tagger'ов.
Reply
Leave a comment