Статистический анализ результатов израильских выборов 2009 года

Dec 13, 2011 20:09

Результаты голосования по разным избирательным участкам (קלפי) на выборах в Кнессет 2009 года дают материал для проведения статистического анализа, аналогичного тому, который был проведен по данным недавних российских выборов и выявил в них аномалии, вызывающие серьезные подозрения в фальсификации выборов.

Заранее предупреждаю, что никаких сенсаций по Израилю не будет, хотя некоторые графики весьма любопытны и могут быть интересны разбирающимся в статистике. Я исходил из предположения, что серьезных нарушений при подсчёте голосов в Израиле не было. Наблюдатели сообщали об отдельных случаях “вливания” в харедимном и арабском секторах. Такие вливания хотя и могли добавить по одному мандату (скорее всего меньше) соответствующим партиям, но в целом по стране их влияние ничтожно.

Сравнение статистических аномалий в данных израильских выборов (в моем предположении с незначительным количеством фальсификаций) и российских (о серьезных фальсификациях в которых имеются красочные свидетельства) позволяет лучше понять, какие аномалии однозначно указывают на фальсификацию, а какие нет.



Итак, в Израиле 9264 избирательных участков (в 10 раз меньше чем в России).

На графике 1 изображена гистограмма распределения числа избирательных участков по различным процентам голосов, полученных ведущими партиями. Видно, что распределения не очень сильно похожи на нормальные. Все они имеют два максимума. Первый - в районе 0%, отражающий наличие большого числа избирательных участков, в которых партия совсем не пользуется популярностью. Это мусульманские избирательные участки для Ликуда и НДИ; поселения для Кадимы. Больше всего не любят харедимные партии.

1.


Пока что - ничего удивительного. Интереснее со вторым максимумом.

У харедимных партий есть локальный максимум в районе 100%, но этот максимум весьма незначителен. Я специально объединил две харедимные партии вместе, чтобы максимум стал хоть сколько-нибудь заметным. У Кадимы второй максимум очень сильно размазан. У меня нет чёткого объяснения этому факту, но, по-видимому, чем более разнородна публика, голосующая за партию, тем меньше распределение похоже на нормальное. Чтобы как-то подтвердить это, рассмотрим гистограмму, аналогичную приведенной выше, но не для отдельных партий, а для партийных блоков: право-религиозного и лево-арабского. Распределение приведено на графике 2. Здесь уже вообще никакой связи с гауссовым (нормальным) распределением не видно.

2.


Для сравнения приведу аналогичную гистограмму для российских выборов (график 3). Распределение для партии Яблоко очень напоминает ШАС; ЛДПР и СР - НДИ, КПРФ - Ликуд, а ЕР - Кадиму :-).

3.


Единственным отличием (на зато каким !) является наличие для ЕР многочисленных локальных максимумов на процентах кратных 5, - явный признак фальсификации. Никакими естественными причинами любовь русских избирателей к круглым числам объяснить нельзя (точность построения графика - бин = 0.5). Сама же форма распределения, включая неожиданный рост числа избирательных участков в области свыше 90% голосов, поданных за ЕР, вряд ли дают основание для однозначного заключения о фальсификации выборов.

Рассмотрим теперь зависимость между общим процентом проголосовавших на участке избирателей (“явка”) и процентом голосов, поданных за партию (графики 4-8). Каждая точка на этих графиках изображает один избирательный участок: по горизонтали - процент явки на участке, по вертикали - процент голосов, поданных за партию на участке.

4.


5.


6.


7.


8.


Что мы видим. Явка колеблется от 40% до 90%. Узкая полоска внизу, с 0-7% проголосовавших за конкретную партию, соответствует первому максимуму на графике 1 (голосование в арабских населенных пунктах за сионистские партии и в поселениях за левые). Если же рассматривать оставшуюся часть, то для Ликуда процент набранных голосов не сильно зависит от явки (корреляция 0.01). Интуитивно так и должно быть. Процент проголосовавших за НДИ падает с ростом явки (корреляция -0.28), а процент проголосовавших за Кадиму - растёт (корреляция +0.30). Эффект роста процента голосов с ростом явки становится особенно наглядным, если объединить вместе голоса, поданные за три левые партии. Для голосующих за харедимные партии получается два кластера. Один большой - внизу, имеет форму, аналогичную НДИ: падение процента голосов с ростом явки. Второй маленький - вверху справа, соответствующий близкой к 100% явке и близкому к 100% голосованию. Форма распределения для Кадимы похожа на аналогичное распределение для ЕР. Так как отсутствуют свидетельства наблюдателей о серьезных нарушениях при голосовании на участках, где Кадима и левые партии получили высокий процент голосов, то я бы не стал однозначно связывать форму распределения с фальсификацией выборов путём вбросов. Избиратели левых партий живут в кибуцах, а также компактно проживают в престижных районах больших городов. И те и другие имеют традицию (кибуцы) или высокую мотивацию (элиты), чтобы принять участие в голосовании.

Рассмотрим теперь гистограмму явок избирателей (график 9). Для Израиля он имеет типичную колоколообразную форму

9.


Вопреки распространенному мнению о голосовании в харедимном и арабском секторах, только в 7 из 9264 (менее 0.1%) избирательных участков процент проголосовавших превысил 95%. В России же процент избирательных участков с близким к 100%-му голосованию - около 10% (см. график 10, на котором, правда, представлены данные выборов 2007 года). Это ещё один явный признак фальсификации российских выборов. Обратите внимание на локальные пики явки при значениях 60%, 70%, 80% 90%

10.


Update:
1. Корреляция между процентом проголосовавших за партию и явкой имеется и в других странах, в которых наличие серьезных фальсификаций не предполагается. Здесь есть данные про Великобританию, и здесь тоже, а здесь про Германию. Гипотеза о нормальности (или, по-крайней мере, колоколообразности) распределения голосов, поданных за партию в этих странах также не подтверждается. Так что, такие аномалии не являются статистическим обоснованием фальсификации выборов.

2. Резкий пик на 50% в распределении поданных голосов (график 3) является артефактом целочисленного распределения. Грубое объяснение такое. Если брать дроби m/n, где m - случайное число проголосовавших за партию, а n - случайная же явка (m<=n), то соотношение 1/2 будет встречаться чаще чем, скажем, 138/275, так как 1/2 может получиться из 2/4 и из 125/250 и т. д., а у 138/275 - гораздо меньше возможностей. Пики, меньшие чем для 1/2, могут появляться и для 1/3 и 2/3; ещё меньшие для 1/4 и 3/4 и т. д. Гистограмма потом сглаживает эти различия и если брать шаг гистограммы больше 1%, то артефактных пиков не видно. При шаге гистограммы в 0.1% (как на графике 3) эффект целочисленности может быть заметен. Так как на графиках 3 и 10 нет заметных пиков в области 66.7% (2/3), то можно считать, что этот красивый сам по себе эффект объясняет выброс в районе 50%, возможно как-то в области 75%, но значительные выбросы на 65%, 70%, 85% и 95% он объяснить не может

Previous post Next post
Up