В SQL словаре - кумулятивные частоты словарных статей из tree bank

Oct 04, 2015 16:59

Закончил перенос новой статистики в словарную базу. Частоты словарных статей берутся из результатов частеречной разметки парсером.

Теперь SQL запрос типа

select C.name, E.name, E.freq
 from sg_entry E, sg_class C
 where E.name in ( 'знать', 'уж' ) and C.id=E.id_class
 order by E.name, E.freq DESC

выдает полезную информацию:

ГЛАГОЛ знать 5108
ИНФИНИТИВ знать 617
ВВОДНОЕ знать 9
СУЩЕСТВИТЕЛЬНОЕ знать 8
ЧАСТИЦА уж 408
НАРЕЧИЕ уж 293
СУЩЕСТВИТЕЛЬНОЕ уж 31

part-of-speech tagging, SQL словарь, ms sql, sql, частеречная разметка

Previous post Next post
Up