Попытка анализа электоральной статистики

Sep 12, 2013 19:01

В энторнетах литературе обсуждается вопрос о причинах отклонения результатов SMS-ЦИК по выборам мэра Москвы от официальных результатов МГИК. Рассматриваются следующие основные гипотезы:

1. Наблюдатели предотвращали фальсификации в пользу Собянина, поэтому на тех участках, где они были, процент за Собянина ниже, чем в среднем по Москве. Поскольку SMS-ЦИК получает данные как раз от наблюдателей, средний процент по SMS-ЦИК будет также ниже, чем средний по Москве.

2. Смещеннось выборки SMS-ЦИК: те районы, которые лучше закрыты наблюдателями - это в точности те же самые районы, в которых жители политически более активны и активнее голосуют против Собянина. Таким образом районы, которые лучше покрыты, дают больший вклад в среднее.

Вдохновленные указанными обсуждениями и исследованием [1], мы попытались провести экспресс-анализ электоральной статистики по прошедшим выборам мэра Москвы. Использовались официальные данные МГИК, которые, по всей видимости, являются достоверным отражением протоколов УИК (по крайней мере, нам не известны сообщения о явных переписываниях протоколов в ТИКах), в машинночитаемом виде доступные здесь, а также информация о расстановке наблюдателей по ВАО (без персональных данных), полученная от координаторов.

Все УИКи были поделены на три типа: хорошо защищенные («зеленая зона»: два и более общественных контролёра, включая ПРГ УИК), слабо защищенные («желтая зона»: один общественный контролёр, включая ПРГ УИК) и незакрытые («красная зона»: нет наших людей). Затем для каждого района были вычислены средние проценты кандидата Собянина по каждому из типов УИКов, а также стандартное отклонение процента кандидата Собянина.

Из анализа были исключены районы, в которых распределение наблюдателей оказалось равномерным (не было возможности выделить хорошо и плохо защищенные УИКи). К сожалению для исследования (и к счастью для результатов), районов с сильно неравномерным покрытием было довольно немного.



Результаты исследования сведены в таблицу 1. При рассмотрении индивидуальных районов, отклонений, выходящих за рамки статистической погрешности, не выявлено. Количественный анализ всей совокупности районов не проводилось - для этого не хватает ни данных, ни квалификации автора. На глазок - существенных отклонений нет.

Указанная схема исследования позволяет исключить смещенность выборки, обсуждаемую в пункте 2 выше: учитывая общую хаотичность процессов подготовки наблюдения, кажется достаточно разумным предположение о том, что наблюдатели в каждом конкретном районе распределялись по участкам более или менее случайным образом, а сами районы относительно однородны по составу населения, и тем самым выполняется предположение об однородности данных. Если точнее, то смещенность выборки в данном случае будет работать «в другую сторону»: координаторы с большей вероятностью пытались закрыть более «проблемные» участки, если таковые были известны заранее (из сообщений ПРГ и т.д.). Таким образом, если бы исследование выявило статистически значимое отклонение на участках без наблюдателей по сравнению с участками с наблюдателями, это было бы сильным аргументом в пользу наличия фальсификаций. Имеющие же результаты свидетельствуют - хоть и с несколько меньшей убедительностью - в пользу отсутствия фальсификаций на тех участках, которые не были закрыты наблюдателями.

Данные результаты являются аргументом в пользу гипотезы о том, что отклонение результатов от официальных данных МГИК объясняется в первую очередь смещенностью выборки (а также, возможно, какими-то нарушениями в Новой Москве и иных районах, не попавших в поле зрения настоящего исследования).

[1] Enikolopov R, Korovkin V, Petrova M, Sonin K, Zakharov A. Field experiment estimate of electoral fraud in Russian parliamentary elections. Proc Natl Acad Sci U S A. 2013 Jan 8;110(2):448-52. doi: 10.1073/pnas.1206770110. Epub 2012 Dec 24.

UPD. Роман Удот из Голоса привёл довольно подробный анализ нескольких районов, примерно по той же методике, что и здесь - в частности, без учёта спецУИКов типа больниц. Вроде бы, всё-таки наблюдается смещение результата Собянина на участках с наблюдателями по сравнению с участками без наблюдателей - примерно на уровне 2% голосов. Пост на первый взгляд выглядит достаточно убедительным. Хотя вопрос о том, в какой мере распределение наблюдателей по УИКам равномерно, всё равно остаётся открытым - учитывая тонкость материй без нормальной рандомизации тяжко. И доверительных интервальчиков бы.

выборы

Previous post Next post
Up