Сборка и работа POSTagger и ParseLine под Linux

Mar 10, 2014 09:11

Утилиты собрались и нормально отработали на тестовых примерах. В принципе, портирование состояло только из написания простеньких makefile-ов и исправления парочки платформозависимостей типа #include в их C++ коде.

POSTagger - это демо-программа для функции sol_MorphologyAnalysis (http://www.solarix.ru/api/ru/sol_MorphologyAnalysis.shtml), которая использует готовую вероятностную морфологическую модель русского языка для разрешения неоднозначностей морфологического разбора слов (типа "ели" - существительное или глагол). Программа работает как консольная утилита, загружая предложение из указанного текстового файла и сохраняя результат в другом текстовом файле. Кстати, именно она в Win32-варианте фактически работает на странице отладочного сервера http://178.64.252.139:8080/POSTagger.aspx

ParseLine - это демо-программа для функции sol_SyntaxAnalysis (http://www.solarix.ru/api/ru/sol_SyntaxAnalysis.shtml), которая выполняет синтаксический разбор предложения с построением синтаксического дерева зависимостей. Она тоже подгружает вероятностую морфологическую модель для того, чтобы при переборе вариантов связывания в первую очередь брать наиболее достоверные варианты морфологического распознавания слов. Эта утилита запускается на тестовой странице http://178.64.252.139:8080/Morphology.aspx?Phrase=%d0%9c%d1%8b+%d0%b5%d0%bb%d0%b8+%d0%b2%d0%ba%d1%83%d1%81%d0%bd%d1%8b%d0%b9+%d1%81%d1%83%d0%bf

морфологический разбор текста, dependency parser, вероятностная русская морфология, Морфологический анализ, part-of-speech tagging, вероятностная модель, linux, частеречная разметка

Previous post Next post
Up