Так о чём и речь. Я товарищу выше сообщаю, что эти опросы - филькины грамоты, а он пускается в математические рассуждения. Что сразу с головой выдаёт человека, который лично никогда не принимал участие в проведении опросов и не знает механику дела. И даже с математической точки зрения - этот kireev никогда в режиме online не наблюдал, как сильно меняются первичные значения опросов по мере увеличения числа введённых и обработанных анкет.
Хотя в принципе и матстат и тервер не обязательно знать - достаточно просто здравой логики. Если спросить мнение одного человека выбрать несколько вариантов ответа, то любой его выбор даст 100% по тому или другому пункту. Если опросить двоих, то возможно как подтверждение 100% выбора, так и деления 50% на 50%. Если опросить сто человек, то возможно окажется, что выбор первого опрошенного будет составлять только 1% от всех вариантов. Конечно есть некоторый порог набора массы опрашиваемых, за которым сколько не увеличивай число респондентов, общий результат будет меняться всего на какие-то десятые доли процента. Но этот порог явно не 10-12 респондентов на город, которые к тому же неизвестно где и по каким признакам опрошены.
Например, если в офисе «Единой России» опросить 10 человек об отношению к Путину, а потом на этом основании говорить о росте доверии к президенту, поскольку 90% опрошенных от него в восторге, то это будет, мягко говоря, сильно далеко от истины. Как, впрочем, и составление мнения на основании десятка опрошенных по тому же вопросу на митинге у Навального.
Боюсь, что я плохо объяснил свою точку зрения. Я совершенно не спорю с тем, что опросы - это филькина грамота. Я спорил исключительно вот с этим утверждением:
"Если вы думаете, что выборка в 3 тыс. опрошенных рыл (а то и меньше) для страны со 140 млн населением - это показательная выборка, то очень прошу, не начинайте нигде разговоров про статистику и социологические опросы. "
- потому что при плохо рандомизированной выборке (стационарные телефоны, таксисты, роты солдат) совершенно неважно, опрашиваете вы три тысячи человек или триста тысяч: в любом случае ваша систематическая ошибка останется прежней и будет иметь чудовищное значение, хоть всех солдат во всей армии опросите.
А вот если вы ухитритесь сделать действительно рандомизированную выборку (что включает в себя, кстати, реальное получение ответов от тех, кто в эту выборку попал, что само по себе непросто) - так вот, в этом случае размер выборки особенного значения не имеет. Ну, после нескольких тысяч человек, конечно - если вас устраивает точность в несколько процентов.
И все соцопросы всегда прокалываются именно на рандомизированности и на самоселекции людей, которые на них вообще захотят отвечать. Проблема именно в этом, а не в тех трех тысячах человек, которые были опрошены, туть хоть в сто раз больше опроси, это ничего не изменит. И даже 10 человек на город - это не такая большая проблема, как вам кажется, если рандомизированный опрос идет по всем городам. В этом городе не зацепили богатых - ну, в другом зацепите. Большое дело.
Другое дело, если у вас богатые - это отдельная группа в опросе, и вас интересует отношение к кефиру среди богатых отдельно, а не только среди всего населения. В этом случае богатые становятся отдельным как бы подопросом, и на них начинают распространяться все те слова про корень из эн, которые я произносил выше. То есть если вы хотите получить такой сегментированный опрос, а богатых всего пять процентов - то да, придется опрашивать не три, а 60 ьысяч человек. А если отношение к кефиру среди богатых города Кинешмы - тут вообще жопа: в ней живет меньше ста тысяч человек, и богатых придется опрашивать вообще чуть ли не всех, чтобы набрать их несколько тысяч.
А вот если вас интересует просто отношение к кефиру среди населения России - то и трех тысяч хватит (из них богатых будет 150 человек. и ошибка в их подопросе будет больше десяти-пятнадцати процентов, но это нас будет мало волновать, потому что вес мнения богатого будет таким же, как и вес мнения бомжа - которого, кстати, тоже придется как-то охватывать этой случайной выборкой). Но в любом случае размер России здесь совершенно не важен, хоть в ней будет 140 миллионов, хоть десять, хоть миллиард. Главное, чтобы все живущие в ней люди были охвачены равновероятной выборкой.
А вот с этим-то у вас и будет проблема, поскольку охотнее всего о кефире с вами будут разговаривать пенсионеры, и ваша оценка его качеств может оказаться из-за этого несколько завышенной. Что вы, впрочем, понимаете и без меня - а вот где у вас, по моему ощущению, имеет место некая иллюзия, так это в том, что вы считаете, что качество опроса можно поднять, опросив больше народу. Фиг, не выйдет. Но если так, то и обратное тоже верно - снижение числа опрошенных с тридцати до трех тысяч не обязательно приводит к радикальному ухудшению качества оценки (нет, то есть точность реально рандомизированного опроса с одного процента до трех, конечно, упадет - но мы ведь сейчас совершенно не об этом).
И ещё многое зависит от постановки вопроса, числа и сути вариантов ответа и т.п. Недавно продлевал лицензию на оружие, по новым правилам положено проходить психолога, после того, как произошло 3-4 убийства домочадцев в ходе семейных ссор (поскольку жертвами оказались стервозные жёны и тёщи, феминистки тут же взвились, как сикели орлами, и продавили через парламент дополнительный заработок психологам и лишние расходы вооружённым гражданам в размере более сотни долларов).
В заведении по тестированию мне подсунули компьютеризованный тест MMPI, а в нём десятая часть вопросов примерно такого вида «Вы перестали пить боярышник по утрам?» с вариантами ответа «да» и «нет». Приходилось просто включать логику, и отвечать «да», хотя и не начинал его пить в любое время суток (логика простая - если человек продолжает бухать с утра, то это хуже, чем если он с этим завязал), то есть, выбирать из 2 сортов дерьма, просто для того, чтобы произвести более благоприятное впечатление. Где гарантия, что в соцопросе не будет таких же заминированных вопросов?
А теперь проведем исключительно мысленный эксперимент. Ваш пример - 5% богатых, президентские выборы etc. ЦИК честная, не чуровская. Допустим, эти самые 5% богатых в полном составе проигнорировали выборы/соцопросы. Как это повлияет на результаты выборов? 5% от всего населения - это в пределах статистической погрешности. Т.е. вовсе не обязательно досконально изучать распределение мнения по группам и учитывать мнение мелких или незначимых (с избирательной позиции) групп. Предположим, в стране 30% пенсионеров/цветных/ортодоксов/ и т.п. и эта социальная группа как правило правктически не участвует в выборах/социальной жизни/чем-то подобном. Следовательно, мнением этой группы можно пренебречь. Не в моральном смысле, разумеется, а в смысле подсчета результатов.
P.S. в предвзятости (пусть будет это слово, оно цензурное) современой российской социологии сомневаться, увы, не приходится (и в мужестве респондентов давать честные оветы в стране, в которй сажают за лайки и репосты), но, зачастую, мнение достаточно большой части населения может не иметь никакого значения для конечного результата. Сравните, например, три гипотетические системы голосования. Есть боле 2-м вариантов ответа/кандидатов/предложений. Голосование проходит в один тур. В первой системе результат подсчитывается простым большинством голосов; во второй - существет некий довольно высокий процентный ценз (пусть будет 80%); в третьей этот ценз - 50% плюс один голос. Очевидно, что в третьем случае нет разницы, единодушны ли 49% процентов оппозиционеров или они разбиты на мелкие фракции, голосующие за свои пункты. В первом-же случае, победитель может иметь лишь незначительную долю от 100, имеет значение что эта доля больше других (которые объединившись могли-бы bla-bla-bla).
P.P.S. Увы, но население РФ довольно внушаемо, многие строят свое мнение на официальной позиции правительства. Многие просто завидуют 'пиндосне'. Многие искренне верят что 'америкосы' вмешиваются в, как они говорят, 'Наши Дела': то СССР развалят, то братушек сербов бомбят, то 'хохлам' заплатили за Майдан. В поединке холодильника и телевизора пока-что побеждает телевизор. Ну а многие ждут куда ветер подует: может помните, как в 90th масса народу заменила партбилет на крестик, но верующими так и не стали. Они и чалму повяжут в одночасье и звездно-полосатые семейники наденут.
Хотя в принципе и матстат и тервер не обязательно знать - достаточно просто здравой логики. Если спросить мнение одного человека выбрать несколько вариантов ответа, то любой его выбор даст 100% по тому или другому пункту. Если опросить двоих, то возможно как подтверждение 100% выбора, так и деления 50% на 50%. Если опросить сто человек, то возможно окажется, что выбор первого опрошенного будет составлять только 1% от всех вариантов. Конечно есть некоторый порог набора массы опрашиваемых, за которым сколько не увеличивай число респондентов, общий результат будет меняться всего на какие-то десятые доли процента. Но этот порог явно не 10-12 респондентов на город, которые к тому же неизвестно где и по каким признакам опрошены.
Например, если в офисе «Единой России» опросить 10 человек об отношению к Путину, а потом на этом основании говорить о росте доверии к президенту, поскольку 90% опрошенных от него в восторге, то это будет, мягко говоря, сильно далеко от истины. Как, впрочем, и составление мнения на основании десятка опрошенных по тому же вопросу на митинге у Навального.
Reply
"Если вы думаете, что выборка в 3 тыс. опрошенных рыл (а то и меньше) для страны со 140 млн населением - это показательная выборка, то очень прошу, не начинайте нигде разговоров про статистику и социологические опросы. "
- потому что при плохо рандомизированной выборке (стационарные телефоны, таксисты, роты солдат) совершенно неважно, опрашиваете вы три тысячи человек или триста тысяч: в любом случае ваша систематическая ошибка останется прежней и будет иметь чудовищное значение, хоть всех солдат во всей армии опросите.
А вот если вы ухитритесь сделать действительно рандомизированную выборку (что включает в себя, кстати, реальное получение ответов от тех, кто в эту выборку попал, что само по себе непросто) - так вот, в этом случае размер выборки особенного значения не имеет. Ну, после нескольких тысяч человек, конечно - если вас устраивает точность в несколько процентов.
И все соцопросы всегда прокалываются именно на рандомизированности и на самоселекции людей, которые на них вообще захотят отвечать. Проблема именно в этом, а не в тех трех тысячах человек, которые были опрошены, туть хоть в сто раз больше опроси, это ничего не изменит. И даже 10 человек на город - это не такая большая проблема, как вам кажется, если рандомизированный опрос идет по всем городам. В этом городе не зацепили богатых - ну, в другом зацепите. Большое дело.
Другое дело, если у вас богатые - это отдельная группа в опросе, и вас интересует отношение к кефиру среди богатых отдельно, а не только среди всего населения. В этом случае богатые становятся отдельным как бы подопросом, и на них начинают распространяться все те слова про корень из эн, которые я произносил выше. То есть если вы хотите получить такой сегментированный опрос, а богатых всего пять процентов - то да, придется опрашивать не три, а 60 ьысяч человек. А если отношение к кефиру среди богатых города Кинешмы - тут вообще жопа: в ней живет меньше ста тысяч человек, и богатых придется опрашивать вообще чуть ли не всех, чтобы набрать их несколько тысяч.
А вот если вас интересует просто отношение к кефиру среди населения России - то и трех тысяч хватит (из них богатых будет 150 человек. и ошибка в их подопросе будет больше десяти-пятнадцати процентов, но это нас будет мало волновать, потому что вес мнения богатого будет таким же, как и вес мнения бомжа - которого, кстати, тоже придется как-то охватывать этой случайной выборкой). Но в любом случае размер России здесь совершенно не важен, хоть в ней будет 140 миллионов, хоть десять, хоть миллиард. Главное, чтобы все живущие в ней люди были охвачены равновероятной выборкой.
А вот с этим-то у вас и будет проблема, поскольку охотнее всего о кефире с вами будут разговаривать пенсионеры, и ваша оценка его качеств может оказаться из-за этого несколько завышенной. Что вы, впрочем, понимаете и без меня - а вот где у вас, по моему ощущению, имеет место некая иллюзия, так это в том, что вы считаете, что качество опроса можно поднять, опросив больше народу. Фиг, не выйдет. Но если так, то и обратное тоже верно - снижение числа опрошенных с тридцати до трех тысяч не обязательно приводит к радикальному ухудшению качества оценки (нет, то есть точность реально рандомизированного опроса с одного процента до трех, конечно, упадет - но мы ведь сейчас совершенно не об этом).
Reply
В заведении по тестированию мне подсунули компьютеризованный тест MMPI, а в нём десятая часть вопросов примерно такого вида «Вы перестали пить боярышник по утрам?» с вариантами ответа «да» и «нет». Приходилось просто включать логику, и отвечать «да», хотя и не начинал его пить в любое время суток (логика простая - если человек продолжает бухать с утра, то это хуже, чем если он с этим завязал), то есть, выбирать из 2 сортов дерьма, просто для того, чтобы произвести более благоприятное впечатление. Где гарантия, что в соцопросе не будет таких же заминированных вопросов?
Reply
Допустим, эти самые 5% богатых в полном составе проигнорировали выборы/соцопросы. Как это повлияет на результаты выборов? 5% от всего населения - это в пределах статистической погрешности. Т.е. вовсе не обязательно досконально изучать распределение мнения по группам и учитывать мнение мелких или незначимых (с избирательной позиции) групп. Предположим, в стране 30% пенсионеров/цветных/ортодоксов/ и т.п. и эта социальная группа как правило правктически не участвует в выборах/социальной жизни/чем-то подобном. Следовательно, мнением этой группы можно пренебречь. Не в моральном смысле, разумеется, а в смысле подсчета результатов.
P.S. в предвзятости (пусть будет это слово, оно цензурное) современой российской социологии сомневаться, увы, не приходится (и в мужестве респондентов давать честные оветы в стране, в которй сажают за лайки и репосты), но, зачастую, мнение достаточно большой части населения может не иметь никакого значения для конечного результата. Сравните, например, три гипотетические системы голосования. Есть боле 2-м вариантов ответа/кандидатов/предложений. Голосование проходит в один тур.
В первой системе результат подсчитывается простым большинством голосов; во второй - существет некий довольно высокий процентный ценз (пусть будет 80%); в третьей этот ценз - 50% плюс один голос.
Очевидно, что в третьем случае нет разницы, единодушны ли 49% процентов оппозиционеров или они разбиты на мелкие фракции, голосующие за свои пункты. В первом-же случае, победитель может иметь лишь незначительную долю от 100, имеет значение что эта доля больше других (которые объединившись могли-бы bla-bla-bla).
P.P.S. Увы, но население РФ довольно внушаемо, многие строят свое мнение на официальной позиции правительства. Многие просто завидуют 'пиндосне'. Многие искренне верят что 'америкосы' вмешиваются в, как они говорят, 'Наши Дела': то СССР развалят, то братушек сербов бомбят, то 'хохлам' заплатили за Майдан. В поединке холодильника и телевизора пока-что побеждает телевизор.
Ну а многие ждут куда ветер подует: может помните, как в 90th масса народу заменила партбилет на крестик, но верующими так и не стали. Они и чалму повяжут в одночасье и звездно-полосатые семейники наденут.
Reply
Leave a comment