Корпусные экивоки

Nov 06, 2010 22:04

Залезла в НКРЯ по бытовым надобностям: внук спросил насчет ноябрей в русской поэзии, а мне, кроме парочки примеров из Пушкина, ничего на память не приходило. Наткнулась на удивительное: поэтический корпус выдал мне 414 примеров, из которых десятка два нашлись собственно в стихах, примерно столько же - в названиях и авторских примечаниях, а остальные…. в датах. Причем не только в тех, которые, видимо, были проставлены авторами, но и в тех, которые очевидным образом вставлены в печатные издания редакторами/публикаторами. Не веря своим глазам, полезла смотреть, нет ли соотв. кнопки в параметрах поиска, - чтоб элиминировать посторонние включения в поэт. тексты (как это предусмотрено, напр., для dubia). Нету, вроде.

Чивой-то кривоватенько получается, граждане комкоры. Понятно, что проблема актуальна для двух десятков существительных и энного количества числительных (тут, кроме дат, при поиске учитываются еще и номера текстов, а кое-где и номера строк в сканированных собраниях!), но если этот баг (или фичу?) не поправить, то поиск в этом сегменте будет сильно засорен, а выборки, мягко говоря, - не слишком адекватны материалу.

филология и вокруг

Previous post Next post
Up