да, линия с хомским как по нотам, выгодный также ход с отодвиганием порожд.грамматики немного в историческую тьму ("лингвисты старой школы"), но что тут скажешь, это необходимый элемент больше меня конечно всегда расстраивает (искренне!) мнимая доступность данных корпуса для исследований. вот мне например для исследований нужны бывают статистики, а не примеры - и все, корпуса для меня нет. в текстовом виде его получить никак нельзя чтобы посчитать самой (как я понимаю, из-за копирайтных дел), на сайте никаких инструментов не прикручено. какая остается корпусная лингвистика? довольно небольшая
А цифры контекстов, которые выдаёт корпус, тебя не устраивают? (Я понимаю, что, скорее всего, вопрос глупый, но тем не менее, интересно, чего в корпусе не хватает.)
навскидку вот что:isyaOctober 27 2009, 20:57:26 UTC
например, нередко нужно расклассифицировать уже найденные контексты (и средствами фильтрации это может не делаться - эти средства (пока?) далеки от идеала.)
просто брать выданную цифру может быть очень опасно, не всегда понятно, что туда может попасть, из-за неточности фильтрации.
Я не понял, почему невозможно. Возможно и проводятся. Или мы по-разному понимаем, что такое "статистическое исследование", но тогда поясните, что Вы имеете в виду.
Нет, я не понял всё равно. На любой запрос корпус выдаёт число контекстов, удовлетворяющих запросу. Разумеется, от качества разметки корпуса и счётчика зависит, насколько выданные корпусом контексты реально соответствуют запросу и насколько выданная цифра соответствует действительности, однако привести эти два соответствия к идеалу, насколько я понимаю, техническая задача. Вот Вам и статистика. Чего Вам не хватает?
Comments 40
больше меня конечно всегда расстраивает (искренне!) мнимая доступность данных корпуса для исследований. вот мне например для исследований нужны бывают статистики, а не примеры - и все, корпуса для меня нет. в текстовом виде его получить никак нельзя чтобы посчитать самой (как я понимаю, из-за копирайтных дел), на сайте никаких инструментов не прикручено.
какая остается корпусная лингвистика? довольно небольшая
Reply
Reply
Reply
просто брать выданную цифру может быть очень опасно, не всегда понятно, что туда может попасть, из-за неточности фильтрации.
Reply
Reply
Reply
Reply
Reply
http://www.russian.slavica.org/article9068.html
Reply
Leave a comment