В дополнение к посту " Синтагрус, UDPipe и Spacy" Я проверил еще и Turku NLP, поскольку там русская модель тоже обучалась на том же самом Синтагрусе. Последовательность шагов для создания докера с русской моделью и выполнение разбора сделаны по мануалу. В консоли делаем так: ( Read more... )
Синтагрус - один из самых популярных корпусов для тренировки русскоязычных POS tagger'ов и парсеров. И у этой всеобщности есть обратная сторона, о которой не следует забывать.