Leave a comment

fbmk October 26 2009, 21:46:07 UTC
что именно спорно?
(если отложить в сторону некоторое преувеличение проблемы противостояния корпуса и Хомского)
мне как раз показалось, что всё прописные истины, ни к чему и ни придерешься (правда, ответ на реплику Бори Долгина про социологию не является ответом, но и реплика несколько в сторону, в любом случае, это только по процедурному вопросу)

Reply

fbmk October 26 2009, 22:37:21 UTC
Собственно, это показательная несостыковка. Б. Долгин упоминает социологические методы («Случайность» выборки надо формировать вполне искусственно), докладчик возвращается к тому, что говорил до этого, а это просто дилемма "массовое vs. случайное, единичное", что само по себе недалеко от "грамматично vs. неграмматично".
Н.В. Перцов в РЯНО на основе корпусных данных указывал, что запреты, которыми оперировали Мельчук и Апресян, могут нарушаться. Но само по себе это не так интересно, как была бы интересна хотя бы количественная и качественная оценка того, как соотносятся такие (всё-таки явно маргинальные) примеры и "регулярные", тут могли бы быть социологические методы и сложные вопросы о том, как считать.

Reply

olesar October 27 2009, 16:52:08 UTC
насколько я понимаю, "квантитативная корпусная лингвистика" как направление уже утвердилось, а споры там как раз и идут, брать ли "все" или брать "выборки". статистические методы лучше разработаны для групп равного размера, это факт, но есть попытки развить аппарат в том направлении, чтобы подавить фактор размера.

Reply

isya October 26 2009, 22:58:50 UTC
рассуждения про "невидимость объекта", мягко говоря, необоснованны (предмет изучения биологии или физики ничуть не более осязаем, чем предмет изучения лингвистики; философски очень наивно утверждать, что именно лингвистический объект какой-то особенный. такая наивность может следовать из упрощенного, школьно-натурализованного представления о других естественных науках ( ... )

Reply

fbmk October 27 2009, 16:17:37 UTC
Гнесеологические проблемы есть у любой науки, но у синхронной лингвистики, основанной на интроспекции, проблемы значительно круче.

То, что ты называешь странным (полемический запал и ощущение революции), мне странным совершенно не кажется. Вполне естественная риторическая позиция.

Тем более неудивительно выделение корпусов. Согласно этой позиции (разделяемой мною) надежность корпусных данных на порядок выше, чем надежность экспериментов. Я хорошо помню из экспедиций, что опросы по анкете - очень полезная вещь, но дают некоторый процент лажи даже если и собиратель, и информант очень хороши.

Reply

isya October 27 2009, 17:46:50 UTC
pro nadezhnost' ja s toboj ne mogu soglasit'sja. opros informanta k eksperimentu imeet ochen' malo otnoshenija. primerno takoe zhe, kak vypiska primerov iz desjatka stranic Dostoevskogo imeet k poisku v korpuse. to, chto ty etogo ne ponimaesh, ja dumaju, svidetel'stvujet ob ochen' malen'kom urovne znanija o proisxodjaschem v mire v etoj oblasti.
t.e. pro korpusa informacija doshla, i v nix vljubilis', a pro vse ostal'noe poka prosto ne znajut tolkom.

eto kak raz xorosho ob'jasnjaet, pochemu V.A. vydeljaet imenno korpusa - ja dumaju, u nego primerno takie zhe prichiny, chto i u tebja,

Reply

fbmk October 27 2009, 17:49:54 UTC
может быть
тем более не вижу в этом ничего удивительного

Reply

petrark October 27 2009, 19:03:22 UTC
А как быть с языками, для которых нет больших корпусов и нет возможности проводить массовые эксперименты? Таких языков - 99 %. Приходится работать по старинке - мучить информанта да выписывать примеры из тех десяти текстов, что ты смог собрать.

Reply

fbmk October 27 2009, 20:34:37 UTC
Обычно тексты записывать значительно легче. Понятно, что для некоторых задач и десятков часов текстов недостаточно, но есть сомнение, что мучения информанта, подкрепленные всего лишь 10 текстами (если текст - это что-то вроде пары страниц), достоверны.

Reply

petrark October 27 2009, 21:45:57 UTC
Снова встаёт вопрос о том, что такое достоверность и почему суждения носителя (лучше, конечно, согласованные суждения группы носителей) могут подвергаться сомнению.

Reply

fbmk October 28 2009, 10:54:40 UTC
Хорошо, можно считать, что вопрос скорее количественный.
Одному несогласованному ответу носителя доверия сильно меньше, чем hapax legomenon.
Хотя, конечно, у вопроса есть и "философская" сторона.

Reply

isya October 27 2009, 20:49:29 UTC
да так же, как раньше. по меньшей мере наивно считать, что с "корпусной революцией" или любой другой "революцией" нужно забывать про "традиционные" методы.

самые неприятные примеры российской корпусной лингвистики, кажется, связаны как раз с неприменением вполне традиционных методов - раз у нас есть корпус, значит, вроде как можно про анализ материала и забыть. понятно, что так не должно быть.

Reply

petrark October 27 2009, 19:00:46 UTC
А кто проверял, какой процент лажи дают корпуса? Допустим, у нас большой корпус и мы изучаем то, что в нём встречается часто (надо ещё определить, что значит это "часто"). Ну а если мы изучаем то, что в корпусе встречается редко?

Reply

fbmk October 27 2009, 20:29:33 UTC
В той степени, в которой корпусная лингвистика развивается как точная наука, она должна давать ответы на эти вопросы (на самом деле даже более точные, чем дает социология). Понятно, что самые общие представления о статистической погрешности есть и без корпусной лингвистики, но приложение этого к лингвистическому материалу имеет свою специфику, как кажется.

Reply

petrark October 27 2009, 21:44:22 UTC
Я боюсь, что тут скорее возникает вполне философский вопрос о том, что такое лингвистически факт и, в частности, может ли hapax legomenon считаться фактом. Статистика такая штука, что в её погрешность могут ненароком попасть самые интересные факты.

Reply

isya October 27 2009, 20:54:26 UTC
> Гнесеологические проблемы есть у любой науки, но у синхронной лингвистики, основанной на интроспекции, проблемы значительно круче.

у синхронной лингвистики, основанной на интроспекции, нет никаких особенных гносеологических проблем такого рода, кажется. сама по себе эта лингвистика не заявляет какую-то невероятную особенность собственного объекта (а исторически как раз наоборот двигавшие ее исследователи помогли совершить преобразование лингвистики в естественную науку, вроде биологии.)

> То, что ты называешь странным (полемический запал и ощущение революции), мне странным совершенно не кажется. Вполне естественная риторическая позиция.

Ну да, риторическая позиция нормальная. Странной она мне кажется потому, что я как-то по-другому представляю себе разговор о науке, но это вопрос вкуса, естественно.

Reply


Leave a comment

Up