Сравнение скорости работы part-of-speech tagger'ов

Apr 02, 2020 12:21

Кроме качества определения частей речи и тегов, у POS Tagger'ов с точки зрения использования во многих реальных проектах есть вторая важная характеристика - скорость. Иногда соображения компромисса вынуждают смириться с некоторой потерей качества ради выигрыша по времени обработки. В конце концов, есть большая разница между 8 и 2 часами на ( Read more... )

part-of-speech tagging, benchmark, pos tagger

Leave a comment

Comments 2

p2004r April 2 2020, 12:11:52 UTC
А все ли предложения с одинаковой скоростью обрабатываются? Может можно сделать "синтетический парсер", который лучшие стороны всех этих вариантов объединит?

Ну или наоборот "легкие к ошибкам" типы предложений выделить и кормить тем парсерам которые меньше ошибаются?

Reply

kelijah April 2 2020, 14:36:51 UTC
>Может можно сделать "синтетический парсер", который лучшие стороны всех этих вариантов объединит?

Такая солянка, или говоря умно "ансамбль" :), тяжеловато тащить куда-то в продакшн.
Только в ресече на некоторых задачах.
Я так улучшал качество разметки, соотнося результаты двух pos tagger'ов.

Reply


Leave a comment

Up