Статистический анализ результатов выборов президента Украины в 2014 году

Jun 01, 2014 15:55


Для анализа были взяты данные с сайта ЦИК Украины http://www.cvk.gov.ua/vp2014 . При этом мной не были учтены данные голосования по заграничным округам, так как количество проголосовавших там мало по сравнению с общим числом, так что вклад в результат минимален, а распределение обычно сильно отличается основного, что затрудняет анализ. Из-за этого приведенные данные могут чуть-чуть отличаться от официальных.
Еще одна причина возможного расхождения результатов - Крым и Севастополь. На сайте ЦИК в разделе о численности избирателей они присутствуют, а о данных голосования их нет совсем, так что мною они не брались. В некоторых областях по некоторым округам данные о голосовании отсутствуют, в этом случае я брал число проголосовавших как нулевое, а доли проголосовавших как неопределенное, то есть в анализе эти данные не участвовали.
В результате из 225 избирательных округов использовались данные по 189 округам.
Для того, чтобы читателям было проще ориентироваться, я буду параллельно приводить результаты по другим выборам и сравнивать результаты.

1. Явка
Во время скандальных последних выборов в Думу России одна из самых обсуждаемых тем было то, что вместо «кривой Гаусса» в распределении явки по округам получилась «пила Чурова»:


Помимо участков с очень высокой явкой (это были спецучастки - воинские части, больницы и СИЗО) были также характерные всплески сразу после явки, превышающей круглое число процентов. К сожалению, на сайте ЦИК Украины были представлены данные не по избирательным участкам, а по округам, при переходе к которым подобные эффекты становятся незаметными.
Для Украины распределение явки оказалось следующим


Здесь по оси X - доля избирателей, принявших участие в голосовании, а по оси Y - число округов.
На Гаусса здесь так же непохоже. Разумеется, чистый «Гаусс» и не должен быть, так как он получается только при заведомо идеализированных условиях, однако для примера приведу распределение по явке на некоторых других выборах:


Явка на выборы заметно различается в разных областях, причем в каждой области она очень однородна. На приведенном ниже графике столбиком показана средняя явка, а полосами погрешности - границы от минимальной по округам до максимальной:



2. Испорченные бюллетени
Сумма голосов, поданных за кандидатов, не совпадала с общим количеством проголосовавших и была немного меньше. Я считал это за испорченные бюллетени, так как в официальной статистике такого не было.
Распределение по доле испорченных бюллетеней среди принявших участие в голосовании было следующее:


Везде доля таких бюллетеней была не менее полупроцента и разбросы по этому количеству были очень велики. Также была получена сильная связь доли испорченных бюллетеней с долей принявших участие в голосовании:


На этом графике по оси X - доля явки на голосование, по оси Y - доля испорченных среди принявших участие в голосовании. Следовательно, чем выше была явка, тем меньше портили бюллетени.

3. Распределение голосов
Таблица со статистическими результатами анализа по округам выглядит так:


Замечу, что среднее по округам не должно точно совпадать с официальными совокупными данными (так, за Порошенко официально около 55%, а здесь - 52%) по двум причинам:
А) Округа разной численности
Б) На них разная явка, и там, где больше протестные настроения, и явка ниже, и доля поданных голосов за основного кандидата тоже ниже.
Однако есть некоторые особенности в полученных результатах, которые мне резко не нравятся. Это - степень вариативности голосования за основных претендентов.
По идее чем больше набирает кандидат, там меньше должна быть вариация поданных за него голосов в разных округах. Оценивать степень вариативности можно по коэффициенту вариации (отношению среднеквадратичного отклонения к среднему), коэффициенту асимметрии (ноль, если распределение симметрично, положительно, если встречаются выбросы в большую сторону, и отрицательно, если в меньшую) и коэффициенту эксцесса (степень выраженности выбросов). Однако для кандидатов с достаточно большими количествами голосов эта тенденция достаточно слабая. Здесь же за Порошенко везде доля проголосовавших почти одинаковая.
Особенно странно это, если сравнивать вариабельность доли голосов, отданных за основных кандидатов, с вариацией явки. Насколько помню, явка всегда более вариабельна, так как нелояльность региона прежде всего отражается в неучастии на выборах, здесь же коэффициент вариации явки вдвое больше, чем отданных за Порошенко голосов.
Даже если отбросить округа, в которых явка была менее 25%, то коэффициент вариации явки составит 15%, а коэффициент вариации голосов за Порошенко - 10%.
Далее гистограммы распределения поданных голосов за 3 первых претендентов. По оси X - доля отданных голосов среди принявших участие в голосовании, по оси Y - число округов.









4. Связь голосования и явки
Сильным аргументов в пользу того, что на думских выборах в России были вбросы, явилась неожиданная регрессионная связь явки и результатов голосования. Если Y - число голосов, подданных за данного претендента, а X - количество пришедших на голосование на данный участок, то ожидаемая связь между ними имеет вид
Y=MX
Где M - доля голосов, отданных за этого кандидата в целом. Если же имеются вбросы разной интенсивности в пользу данного кандидата, то связь становится вида
Y=a+bX
Где a меньше 0 и b больше M.
Соответственно для других кандидатов, которых обидели и голоса которых украли, связь Y=a+bX будет с a больше 0 и b меньше М.
Так что я не буду ничего далее объяснять и комментировать, а просто приведу полученные коэффициенты для регрессионного анализа по кандидатам:



То есть те соотношения, которые в думских выборах были приняты как доказательства вбросов в пользу ЕР, на выборах на Украине тоже наблюдались в пользу Порошенко, Тимошенко, Ляшко и Тягнибока.
А вот Рабиновича, как и многих других, обидели


В верхнее тематическое оглавление

Тематическое оглавление (Политика)

Выборы, Текущая политика

Previous post Next post
Up