Боюсь, что я плохо объяснил свою точку зрения. Я совершенно не спорю с тем, что опросы - это филькина грамота. Я спорил исключительно вот с этим утверждением:
"Если вы думаете, что выборка в 3 тыс. опрошенных рыл (а то и меньше) для страны со 140 млн населением - это показательная выборка, то очень прошу, не начинайте нигде разговоров про статистику и социологические опросы. "
- потому что при плохо рандомизированной выборке (стационарные телефоны, таксисты, роты солдат) совершенно неважно, опрашиваете вы три тысячи человек или триста тысяч: в любом случае ваша систематическая ошибка останется прежней и будет иметь чудовищное значение, хоть всех солдат во всей армии опросите.
А вот если вы ухитритесь сделать действительно рандомизированную выборку (что включает в себя, кстати, реальное получение ответов от тех, кто в эту выборку попал, что само по себе непросто) - так вот, в этом случае размер выборки особенного значения не имеет. Ну, после нескольких тысяч человек, конечно - если вас устраивает точность в несколько процентов.
И все соцопросы всегда прокалываются именно на рандомизированности и на самоселекции людей, которые на них вообще захотят отвечать. Проблема именно в этом, а не в тех трех тысячах человек, которые были опрошены, туть хоть в сто раз больше опроси, это ничего не изменит. И даже 10 человек на город - это не такая большая проблема, как вам кажется, если рандомизированный опрос идет по всем городам. В этом городе не зацепили богатых - ну, в другом зацепите. Большое дело.
Другое дело, если у вас богатые - это отдельная группа в опросе, и вас интересует отношение к кефиру среди богатых отдельно, а не только среди всего населения. В этом случае богатые становятся отдельным как бы подопросом, и на них начинают распространяться все те слова про корень из эн, которые я произносил выше. То есть если вы хотите получить такой сегментированный опрос, а богатых всего пять процентов - то да, придется опрашивать не три, а 60 ьысяч человек. А если отношение к кефиру среди богатых города Кинешмы - тут вообще жопа: в ней живет меньше ста тысяч человек, и богатых придется опрашивать вообще чуть ли не всех, чтобы набрать их несколько тысяч.
А вот если вас интересует просто отношение к кефиру среди населения России - то и трех тысяч хватит (из них богатых будет 150 человек. и ошибка в их подопросе будет больше десяти-пятнадцати процентов, но это нас будет мало волновать, потому что вес мнения богатого будет таким же, как и вес мнения бомжа - которого, кстати, тоже придется как-то охватывать этой случайной выборкой). Но в любом случае размер России здесь совершенно не важен, хоть в ней будет 140 миллионов, хоть десять, хоть миллиард. Главное, чтобы все живущие в ней люди были охвачены равновероятной выборкой.
А вот с этим-то у вас и будет проблема, поскольку охотнее всего о кефире с вами будут разговаривать пенсионеры, и ваша оценка его качеств может оказаться из-за этого несколько завышенной. Что вы, впрочем, понимаете и без меня - а вот где у вас, по моему ощущению, имеет место некая иллюзия, так это в том, что вы считаете, что качество опроса можно поднять, опросив больше народу. Фиг, не выйдет. Но если так, то и обратное тоже верно - снижение числа опрошенных с тридцати до трех тысяч не обязательно приводит к радикальному ухудшению качества оценки (нет, то есть точность реально рандомизированного опроса с одного процента до трех, конечно, упадет - но мы ведь сейчас совершенно не об этом).
"Если вы думаете, что выборка в 3 тыс. опрошенных рыл (а то и меньше) для страны со 140 млн населением - это показательная выборка, то очень прошу, не начинайте нигде разговоров про статистику и социологические опросы. "
- потому что при плохо рандомизированной выборке (стационарные телефоны, таксисты, роты солдат) совершенно неважно, опрашиваете вы три тысячи человек или триста тысяч: в любом случае ваша систематическая ошибка останется прежней и будет иметь чудовищное значение, хоть всех солдат во всей армии опросите.
А вот если вы ухитритесь сделать действительно рандомизированную выборку (что включает в себя, кстати, реальное получение ответов от тех, кто в эту выборку попал, что само по себе непросто) - так вот, в этом случае размер выборки особенного значения не имеет. Ну, после нескольких тысяч человек, конечно - если вас устраивает точность в несколько процентов.
И все соцопросы всегда прокалываются именно на рандомизированности и на самоселекции людей, которые на них вообще захотят отвечать. Проблема именно в этом, а не в тех трех тысячах человек, которые были опрошены, туть хоть в сто раз больше опроси, это ничего не изменит. И даже 10 человек на город - это не такая большая проблема, как вам кажется, если рандомизированный опрос идет по всем городам. В этом городе не зацепили богатых - ну, в другом зацепите. Большое дело.
Другое дело, если у вас богатые - это отдельная группа в опросе, и вас интересует отношение к кефиру среди богатых отдельно, а не только среди всего населения. В этом случае богатые становятся отдельным как бы подопросом, и на них начинают распространяться все те слова про корень из эн, которые я произносил выше. То есть если вы хотите получить такой сегментированный опрос, а богатых всего пять процентов - то да, придется опрашивать не три, а 60 ьысяч человек. А если отношение к кефиру среди богатых города Кинешмы - тут вообще жопа: в ней живет меньше ста тысяч человек, и богатых придется опрашивать вообще чуть ли не всех, чтобы набрать их несколько тысяч.
А вот если вас интересует просто отношение к кефиру среди населения России - то и трех тысяч хватит (из них богатых будет 150 человек. и ошибка в их подопросе будет больше десяти-пятнадцати процентов, но это нас будет мало волновать, потому что вес мнения богатого будет таким же, как и вес мнения бомжа - которого, кстати, тоже придется как-то охватывать этой случайной выборкой). Но в любом случае размер России здесь совершенно не важен, хоть в ней будет 140 миллионов, хоть десять, хоть миллиард. Главное, чтобы все живущие в ней люди были охвачены равновероятной выборкой.
А вот с этим-то у вас и будет проблема, поскольку охотнее всего о кефире с вами будут разговаривать пенсионеры, и ваша оценка его качеств может оказаться из-за этого несколько завышенной. Что вы, впрочем, понимаете и без меня - а вот где у вас, по моему ощущению, имеет место некая иллюзия, так это в том, что вы считаете, что качество опроса можно поднять, опросив больше народу. Фиг, не выйдет. Но если так, то и обратное тоже верно - снижение числа опрошенных с тридцати до трех тысяч не обязательно приводит к радикальному ухудшению качества оценки (нет, то есть точность реально рандомизированного опроса с одного процента до трех, конечно, упадет - но мы ведь сейчас совершенно не об этом).
Reply
Leave a comment