Некоторые пояснения к тексту от 24.02 ("Предварительные выводы...") : igor

igor_zadorin

Некоторые пояснения к тексту от 24.02 ("Предварительные выводы...")

Mar 03, 2012 11:04

В некоторых блогах комментируемый текст от 24.02, опубликованный только в сети, назвали личным «мнением Задорина» и даже «ангажированным прогнозом». Это понятно, поскольку политические следствия возможной реализации представленного прогноза могут кому-то очень не нравится. Вместе с тем у меня не было намерения задевать кого-то «политически», просто я постарался проанализировать данные, полученные в рамках опроса по проекту «Открытое мнение». И подчеркиваю, с учетом того, что массив данных открыт, каждый может проделать с ним то же самое, что и я. Ну, и, по всей видимости, получить то же, что и я.

Для прогнозирования результатов выборов мною была использована та же методика вероятностного моделирования электорального поведения, которая была разработана еще в 2004 году и которую мы с тех пор уже десятки раз использовали в рамках различных избирательных кампаний (см., например, версию 2006 года http://www.zircon.ru/upload/File/russian/publication/1/060415.ppt для партийных выборов).

Вероятность участия респондента в выборах оценивалась на основе ответов на вопрос «4-ГО МАРТА 12 ГОДА СОСТОЯТСЯ ВЫБОРЫ ПРЕЗИДЕНТА РОССИИ. КАК ВЫ ДУМАЕТЕ, ВЫ ТОЧНО БУДЕТЕ В НИХ УЧАСТВОВАТЬ, СКОРЕЕ ВСЕГО ДА, МОЖЕТ ДА - МОЖЕТ НЕТ, СКОРЕЕ ВСЕГО НЕТ ИЛИ ТОЧНО НЕ БУДЕТЕ?» (вопрос 8 анкеты опроса)

1.1. Использовались следующие коэффициенты вероятности участия в выборах:

1. точно будет

0,75

2. скорее всего да (будет)

0,70

3. Может да, может нет

0,35

4. скорее всего нет (не будет)

0,10

5. точно нет (не будет)

0,05

98. Затрудняется ответить

0,35

99. Отказ от ответа

0,10

1.2. Вероятность явки подвергалась корректировке (увеличению или уменьшению) в зависимости от ответов на вопросы об избирательном участке и предыдущем опыте участия в выборах (вопросы 9, 10, 16). Использовались небольшие повышательные и понижательные коэффициенты от 1,05 до 0,85 (в исключительных случаях, когда респондент живет не в месте регистрации, а в другом населенном пункте - 0,70).

Распределение вероятности голосования за каждого из кандидатов проводилось на основе ответов на вопросы анкеты №№ 11, 12, 13, 14.

2.1 Для базовой оценки вероятности использовались следующие коэффициенты для каждого из ответов на вопрос «В КАКОЙ СТЕПЕНИ ВЫ УВЕРЕНЫ, ЧТО БУДЕТЕ ГОЛОСОВАТЬ ИМЕННО ТАК НА ВЫБОРАХ ПРЕЗИДЕНТА РОССИИ?»

1. Безусловно, уверен, его выбор окончательный

0,90

2. Скорее уверен, так и будет, если не произойдет ничего чрезвычайного

0,80

3. Не вполне уверен в своем выборе, все может измениться

0,65

4. Совершенно не уверен, его выбор вполне вероятно изменится

0,50

98. Затрудняется ответить

0,65

99. Отказ от ответа

0,50

2.2. Остатки вероятности в основном распределялись на основе второго выбора «А ЕСЛИ ЭТОТ (ВЫБРАННЫЙ ВАМИ) КАНДИДАТ НЕ БУДЕТ УЧАСТВОВАТЬ В ВЫБОРАХ, ЗА КОГО ВЫ ПРОГОЛОСУЕТЕ?». Кандидату, выбранному респондентом в этом вопросе, доставалась вся оставшаяся вероятность (до 1).

Надо сказать, что даже после учета вопросов о выборе и втором выборе суммарная нераспределенная на кандидатов вероятность голосования составляла 34%. То есть довольно много респондентов, несмотря на то, что имеют далеко ненулевую вероятность участия в голосования, затруднялись с выбором своего кандидата (или его "заместителя"). Это довольно высокий показатель неопределенности. И тут важно правильно выбрать модель распределения этих «неопределившихся» голосов. Я пробовал распределить хвосты вероятностей для респондентов, затруднившихся ответить на какие-то вопросы или отказавшихся отвечать, на основе двух моделей:

3.1. Модель пропорционального распределения в соответствии с распределением голосов уже определившихся с выбором.

При этом получалось следующее распределение голосов:

Жириновский

7%

Зюганов

11%

Миронов

4%

Прохоров

8%

Путин

70%

Понимаю, что такая модель маловероятна, поскольку голосование неопределившихся скорее всего будет отличаться от голосования уже сделавших выбор, причем вероятнее всего в оппозиционную сторону.

3.2. В связи с вышесказанным была попробована модель, когда половина неопределившихся распределяются по модели голосования уже сделавших выбор, а вторая половина исключительно среди оппозиционных кандидатов. Трудно оценить вероятность реализации такой модели (вообще говоря, это довольно жесткий вариант для Путина), но в каком-то смысле она отражает гипотезы о более оппозиционном настрое респондентов, отказывающихся участвовать в опросах и отказывающихся отвечать. В этом случае получается следующее распределение голосов:

Жириновский

10%

Зюганов

15%

Миронов

6%

Прохоров

11%

Путин

58%

Собственно результаты моделирования по этим двум вариантам и были приведены в тексте от 24.02. Ничего нарочито придуманного и отклоняющегося от обычной модели прогнозирования, не было.

4. На днях я попробовал еще одну модель. Еще более оппозиционную. А именно нераспределенная вероятность голосования делилась между всеми пятью кандидатами поровну (естественно за вычетом попадавших в "черный список" на основе ответов на вопрос «А ЗА КОГО ИЗ ЭТИХ ПОЛИТИКОВ ВЫ НЕ ПРОГОЛОСУЕТЕ НИ ПРИ КАКИХ УСЛОВИЯХ?»). Вообще говоря, такая модель, на мой взгляд, маловероятна, но все-таки приведу результаты моделирования и при таком голосовании.

Жириновский

9%

Зюганов

13%

Миронов

10%

Прохоров

12%

Путин

56%

В общем вот что получается при анализе массива. Подчеркиваю, это результаты более или менее традиционного анализа массива данных, которому я доверяю, а не просто личное "мнение".

ИЗ 02.03.2012