Анализ выборов по составляющим явки

podmoskovnik

Анализ выборов по составляющим явки - 1

Oct 27, 2009 15:26

Ув. andirect, присоединившийся к преступной группировке незаконных математиков дружной компании выборных аналитиков, задался вопросом о восстановлении "правильного" распределения участков по явке.
Подложу и я свои две копейки.

Как уже было не раз показано ( 2007, 2008, Москва-2008, Москва-2009), распределения избирательных участков по явке на наших выборах имеют довольно причудливый характер, в отличие от некоторых других стран ( надоевший всем пример Польши).
Интересно задаться вопросом: кто виноват в таких странных распределениях? Может быть, враги? Интервенты?

Ответ, как обычно, поищем под фонарем. Прибегнем к простому приему. Явка избирателей - это количество бюллетеней в урнах, деленное на количество избирателей, зарегистрированных на участке. Среди этих бюллетеней есть бюллетени за кандидатуру власти, а есть бюллетени за прочие кандидатуры (к которым причислим и кандидатуру "недействительный бюллетень" как заменитель "против всех"). Соответственно разделим явку (полную) на две составляющие, которые условно можно назвать "явкой избирателей кандидатуры власти" и "явкой избирателей остальных кандидатур", и посмотрим, как распределены избирательные участки по этим двум величинам.

Первая картинка. Выборы в ГД-2007.

Итак, распределение избирательных участков по явке избирателей "других партий" выглядит практически как нормальное (гауссово), за исключением небольшого "хвоста" справа и необычного "плеча" слева. Голубая линия - настоящее гауссово распределение для сравнения. Происхождение левого "плеча" проще всего объяснить наличием участков, где у "прочих" партий просто отбирали голоса. Количество таких участков можно оценить по площади между сиреневым и голубым графиками в области ниже явки 10%; получается примерно 7800 участков (из общего числа 96 тысяч); возможно, оценка чуть завышенная из-за того, что левый "хвост" реального распределения может быть выше нормального, как правый (см. ниже).

Заметим, что ширина распределения по явке за "другие" партии существенно больше, чем дает простой биномиальный механизм (каждый избиратель "других" партий приходит на участок в вероятностью 22%). Для участка среднестатистического размера (1000 человек) ожидаемая ширина пика биномиального распределения на половине высоты составляла бы 2.5*sqrt(0.78*0.22*1000)/1000 = 3.3% против наблюдаемых 15%. По-видимому, основной вклад в разброс явки вносят различия между индивидуальными участками, а не статистика явки внутри участка; то, что при этом распределение остается нормальным, вполне ожидаемо для такой большой выборки.

Затянутый "хвост" распределения со стороны больших явок может быть обусловлен несколькими факторами. Во-первых, участки неодинаковы по размерам, и на мелких статистический разброс выше (действительно, в этом хвосте средний размер участка около 300 человек). Во-вторых, дают вклад экзоты типа сельских поселений с высокой явкой и высоким голосованием за Аграрную партию. В любом случае интегральный размер этого хвоста невелик - отклонение от нормального распределения начиная с явки 33% составляет ~3200 участков, т.е. немного больше 3% по числу участков и немного больше 1% по числу избирателей.

Таким образом, распределение участков по голосованию за "другие" партии вполне объяснимо рациональными аргументами, чего нельзя сказать о распределении по голосованию за ЕР, которое выглядит по меньшей мере странно. Зато понятно, что именно голоса за ЕР приводят к столь странному распределению участков по общей явке. Разумное объяснение - голоса за ЕР натягивали административными методами, вбросом и приписками. Примечательно, что на распределении по голосованию за ЕР нет зубцов, которые проявляются на распределении по общей явке; это подтверждает, что показатель общей явки был отдельным важным элементом отчетности. Далее, если предположить, что начальная часть распределения участков по голосам за ЕР представляет собой левую половину гауссианы (что похоже на правду), на глаз получим грубую оценку реального голосования за ЕР в 30% от списочного состава избирателей, что не сильно отличается от оценки, полученной в 2007 году вычитанием "аномальной части" (28.3%).

Для полноты - аналогичная картинка для президентских выборов 2008 года:

Здесь все примерно то же самое, только правый хвост распределения голосования за "прочих" кандидатов побольше. Забавно, что средняя доля голосующих за "прочих" кандидатов от списочного состава избирателей практически такая же, как на думских выборах за "прочие" партии (21.3% против 22%). Опять же, если предположить, что левая часть распределения по голосованию за Медведева - это левая половина гауссианы, на глаз получаем 37% "честных" голосов от списочного состава (оценка вычитанием "аномальной части" давала 35.2%).

В следующей части - про Москву и КОИБы.

анализ, выборы