ТЕКУЩИЕ ИЗМЕНЕНИЯ
1. Эталонный корпус вырос до ~43000 предложений.
2. В нисходящий парсер добавлено очень много новых правил.
3. Для лемматизатора сделана экспериментальная скрытая марковская модель.
4. Эксперименты со статистическим chunker'ом.
СТАТИСТИЧЕСКИЙ ПАРСЕР (CHUNKER)Пока сделал только 2 эксперимента с моделями. В предложении
(
Read more... )