что именно спорно? (если отложить в сторону некоторое преувеличение проблемы противостояния корпуса и Хомского) мне как раз показалось, что всё прописные истины, ни к чему и ни придерешься (правда, ответ на реплику Бори Долгина про социологию не является ответом, но и реплика несколько в сторону, в любом случае, это только по процедурному вопросу)
Собственно, это показательная несостыковка. Б. Долгин упоминает социологические методы («Случайность» выборки надо формировать вполне искусственно), докладчик возвращается к тому, что говорил до этого, а это просто дилемма "массовое vs. случайное, единичное", что само по себе недалеко от "грамматично vs. неграмматично". Н.В. Перцов в РЯНО на основе корпусных данных указывал, что запреты, которыми оперировали Мельчук и Апресян, могут нарушаться. Но само по себе это не так интересно, как была бы интересна хотя бы количественная и качественная оценка того, как соотносятся такие (всё-таки явно маргинальные) примеры и "регулярные", тут могли бы быть социологические методы и сложные вопросы о том, как считать.
насколько я понимаю, "квантитативная корпусная лингвистика" как направление уже утвердилось, а споры там как раз и идут, брать ли "все" или брать "выборки". статистические методы лучше разработаны для групп равного размера, это факт, но есть попытки развить аппарат в том направлении, чтобы подавить фактор размера.
рассуждения про "невидимость объекта", мягко говоря, необоснованны (предмет изучения биологии или физики ничуть не более осязаем, чем предмет изучения лингвистики; философски очень наивно утверждать, что именно лингвистический объект какой-то особенный. такая наивность может следовать из упрощенного, школьно-натурализованного представления о других естественных науках
( ... )
Гнесеологические проблемы есть у любой науки, но у синхронной лингвистики, основанной на интроспекции, проблемы значительно круче.
То, что ты называешь странным (полемический запал и ощущение революции), мне странным совершенно не кажется. Вполне естественная риторическая позиция.
Тем более неудивительно выделение корпусов. Согласно этой позиции (разделяемой мною) надежность корпусных данных на порядок выше, чем надежность экспериментов. Я хорошо помню из экспедиций, что опросы по анкете - очень полезная вещь, но дают некоторый процент лажи даже если и собиратель, и информант очень хороши.
pro nadezhnost' ja s toboj ne mogu soglasit'sja. opros informanta k eksperimentu imeet ochen' malo otnoshenija. primerno takoe zhe, kak vypiska primerov iz desjatka stranic Dostoevskogo imeet k poisku v korpuse. to, chto ty etogo ne ponimaesh, ja dumaju, svidetel'stvujet ob ochen' malen'kom urovne znanija o proisxodjaschem v mire v etoj oblasti. t.e. pro korpusa informacija doshla, i v nix vljubilis', a pro vse ostal'noe poka prosto ne znajut tolkom.
eto kak raz xorosho ob'jasnjaet, pochemu V.A. vydeljaet imenno korpusa - ja dumaju, u nego primerno takie zhe prichiny, chto i u tebja,
А как быть с языками, для которых нет больших корпусов и нет возможности проводить массовые эксперименты? Таких языков - 99 %. Приходится работать по старинке - мучить информанта да выписывать примеры из тех десяти текстов, что ты смог собрать.
Обычно тексты записывать значительно легче. Понятно, что для некоторых задач и десятков часов текстов недостаточно, но есть сомнение, что мучения информанта, подкрепленные всего лишь 10 текстами (если текст - это что-то вроде пары страниц), достоверны.
Снова встаёт вопрос о том, что такое достоверность и почему суждения носителя (лучше, конечно, согласованные суждения группы носителей) могут подвергаться сомнению.
Хорошо, можно считать, что вопрос скорее количественный. Одному несогласованному ответу носителя доверия сильно меньше, чем hapax legomenon. Хотя, конечно, у вопроса есть и "философская" сторона.
да так же, как раньше. по меньшей мере наивно считать, что с "корпусной революцией" или любой другой "революцией" нужно забывать про "традиционные" методы.
самые неприятные примеры российской корпусной лингвистики, кажется, связаны как раз с неприменением вполне традиционных методов - раз у нас есть корпус, значит, вроде как можно про анализ материала и забыть. понятно, что так не должно быть.
А кто проверял, какой процент лажи дают корпуса? Допустим, у нас большой корпус и мы изучаем то, что в нём встречается часто (надо ещё определить, что значит это "часто"). Ну а если мы изучаем то, что в корпусе встречается редко?
В той степени, в которой корпусная лингвистика развивается как точная наука, она должна давать ответы на эти вопросы (на самом деле даже более точные, чем дает социология). Понятно, что самые общие представления о статистической погрешности есть и без корпусной лингвистики, но приложение этого к лингвистическому материалу имеет свою специфику, как кажется.
Я боюсь, что тут скорее возникает вполне философский вопрос о том, что такое лингвистически факт и, в частности, может ли hapax legomenon считаться фактом. Статистика такая штука, что в её погрешность могут ненароком попасть самые интересные факты.
> Гнесеологические проблемы есть у любой науки, но у синхронной лингвистики, основанной на интроспекции, проблемы значительно круче.
у синхронной лингвистики, основанной на интроспекции, нет никаких особенных гносеологических проблем такого рода, кажется. сама по себе эта лингвистика не заявляет какую-то невероятную особенность собственного объекта (а исторически как раз наоборот двигавшие ее исследователи помогли совершить преобразование лингвистики в естественную науку, вроде биологии.)
> То, что ты называешь странным (полемический запал и ощущение революции), мне странным совершенно не кажется. Вполне естественная риторическая позиция.
Ну да, риторическая позиция нормальная. Странной она мне кажется потому, что я как-то по-другому представляю себе разговор о науке, но это вопрос вкуса, естественно.
(если отложить в сторону некоторое преувеличение проблемы противостояния корпуса и Хомского)
мне как раз показалось, что всё прописные истины, ни к чему и ни придерешься (правда, ответ на реплику Бори Долгина про социологию не является ответом, но и реплика несколько в сторону, в любом случае, это только по процедурному вопросу)
Reply
Н.В. Перцов в РЯНО на основе корпусных данных указывал, что запреты, которыми оперировали Мельчук и Апресян, могут нарушаться. Но само по себе это не так интересно, как была бы интересна хотя бы количественная и качественная оценка того, как соотносятся такие (всё-таки явно маргинальные) примеры и "регулярные", тут могли бы быть социологические методы и сложные вопросы о том, как считать.
Reply
Reply
Reply
То, что ты называешь странным (полемический запал и ощущение революции), мне странным совершенно не кажется. Вполне естественная риторическая позиция.
Тем более неудивительно выделение корпусов. Согласно этой позиции (разделяемой мною) надежность корпусных данных на порядок выше, чем надежность экспериментов. Я хорошо помню из экспедиций, что опросы по анкете - очень полезная вещь, но дают некоторый процент лажи даже если и собиратель, и информант очень хороши.
Reply
t.e. pro korpusa informacija doshla, i v nix vljubilis', a pro vse ostal'noe poka prosto ne znajut tolkom.
eto kak raz xorosho ob'jasnjaet, pochemu V.A. vydeljaet imenno korpusa - ja dumaju, u nego primerno takie zhe prichiny, chto i u tebja,
Reply
тем более не вижу в этом ничего удивительного
Reply
Reply
Reply
Reply
Одному несогласованному ответу носителя доверия сильно меньше, чем hapax legomenon.
Хотя, конечно, у вопроса есть и "философская" сторона.
Reply
самые неприятные примеры российской корпусной лингвистики, кажется, связаны как раз с неприменением вполне традиционных методов - раз у нас есть корпус, значит, вроде как можно про анализ материала и забыть. понятно, что так не должно быть.
Reply
Reply
Reply
Reply
у синхронной лингвистики, основанной на интроспекции, нет никаких особенных гносеологических проблем такого рода, кажется. сама по себе эта лингвистика не заявляет какую-то невероятную особенность собственного объекта (а исторически как раз наоборот двигавшие ее исследователи помогли совершить преобразование лингвистики в естественную науку, вроде биологии.)
> То, что ты называешь странным (полемический запал и ощущение революции), мне странным совершенно не кажется. Вполне естественная риторическая позиция.
Ну да, риторическая позиция нормальная. Странной она мне кажется потому, что я как-то по-другому представляю себе разговор о науке, но это вопрос вкуса, естественно.
Reply
Leave a comment