Sep 14, 2011 06:19
Что будет: добавление большой порции словарных статей, по прикидкам примерно 10-15 тысяч, может даже больше, из категории современной лексики. Сырье - заметки из журналов и так далее.
Из того, что уже просматривается - большое количество прилагательных типа 'кондопожский' или 'урус-мартановский', то есть образованных от топонимов. По возможности с указанием в тезаурусе на родительское существительное, то бишь Кондопога и Урус-Мартан соответственно.
В довесок будет расширен набор правил распознавания по аффиксам, чтобы морфоанализатор лучше справлялся.
текущие планы,
лексикон,
лексика,
словарные статьи