Результаты выборов. Методология восстановления.

Dec 22, 2011 18:30

Предполагалось, что этот пост будет посвящён анализу выборов в регионах, но выяснилось, что применённая методология требует существенных уточнений. К тому же уважаемый
podmoskovnik в своём посте выложил ссылку на файл с окончательными результатами выборов .

Предыдущий пост был посвящён реализации идеи аппроксимации исходных характеристик распределения явки гауссовым, с последующим подбором параметров этого распределения. Идея оказалась крайне плодотворной, однако после уточнения критериев оказалось что подобранное распределение не очень хорошо (даже, можно сказать, очень плохо) соответствует действительности. Выяснилось, что некоторые принципы, заложенные в метод построения, не совсем корректны.
А именно: 1) кривая исходного распределения базировалась на допущении, что в начальной своей стадии, в области малых явок она почти  совпадает с истинным распределением. Однако это не совсем так. Если считать, что вероятность фальсификаций не зависит от истинной (до искажения вбросами и приписками) явки, то очевидно, что уже в начальной своей стадии показанная кривая будет лежать ниже правильной исходной, что объясняется уходом,  перемещением определённого процента   участков в область бОльших явок после вброса.
2) другая неточность связана с привязкой ниспадающей ветви гауссианы к точке перемены тенденций между ЕР и остальными партиями. Оказалось, что это также не так, гауссиана пересекает кривую показанной явки в области [иногда значительно] меньших процентов.
Более соответствующая действительности кривая выглядит вот так:



Здесь аппроксимированная и показанная явки отображены в нормированном виде (площади под кривыми равны 100%), распределения за партии - в масштабе показанной явки (сумма кривых тоже равна 100%). Удобнее для анализа представлять данные по партиям также в нормированном виде:



Голоса за партии (без ЕР) здесь объединены вместе, а также добавлена кривая корректированной явки - кривая показанной явки, увеличенная на процент вброшенных бюллетеней (в нашем случае на 22,4%, это получается из отнесения 11% вброшенных бюллетеней на 49,12% восстановленной истинной явки). Эта кривая необходима, чтобы последующий анализ проводить в процентах правильно показанной явки. Хорошо видно, что кривая недействительных бюллетеней в начальной своей стадии, примерно до 49%, хорошо соответствует кривой явки, а затем постепенно опускается ниже (это происходит из-за добавленных бюллетеней за ЕР, которые появляются и увеличиваются с ростом явки). Соответствие  истинному числу - ценное свойство недействительных бюллетеней, которые не вбрасывали и не изымали в процессе подсчёта голосов (подтверждается анализом расхождений между копиями наблюдателей и результатами ЦИК, /эта информация аккумулируется на сайте ruelect.com где можно видеть, что все фальсификации не касаются количества недействительных бюллетеней. В будущем используем это для восстановления распределения вброса и подсчёта дополнительных фальсификаций из-за переписывания голосов в пользу ЕР от остальных партий, которое невозможно определить анализом формы распределения.

Коротко о критериях и методике получения кривой. Вот картинка, которая иллюстрирует технологию этого процесса:



Кривая подобрана с учётом минимизации ошибок от следующих критериев:
1) Разница площадей фигур соответствует указанному проценту вброса (основное условие);
2) Отклонения формы гауссианы от формы показанной явки (с учётом также подбираемого корректирующего коэффициента, показывающего долю "честных" оставшихся участков, который получился равным 0,307 - 31% - доля честных участков, 69% - доля участков со значительными фальсификациями), точность попадания видна по 5 зелёным точкам, соответствующим 25, 28, 30, 34, 36% явки (точки для наглядности пересчитаны на гаусиану). Для компенсации уменьшения влияния самых важных начальных точек (так как они очень близко к 0 и их ошибки меньше влияют на оптимизацию) они взяты с большим весом. 
3) Также оптимизируемым фактором являлось совпадение начальной части (до  50% явки) кривой явки с кривой количества испорченных бюллетеней (предполагалось уменьшение кривой испорченных на 4% из за разбавления на последних процентах некоторым количеством вброшенных за ЕР).

Индикатором вброса является (тонкая коричневая)  линия процентного вброса, которая вычислена по падению количества недействительных бюллетеней относительно показанной явки. Толстая коричневая линия показывает значение абсолютного вброса (как произведение относительного на показанную явку) и может являться оценкой распределения вброса на оси показанной явки.

Выводы следующие:
 1.Определилось значение абсолютного вброса, равного 11% от количества избирателей (примерно 12  млн. бюллетеней, каждый пятый обнаруженный/приписанный - фальшивый). 
2.Не удалось достичь правильного соотношения количества вброшенных бюллетеней в начале явки, получились парадоксальные отрицательные числа, которых, по-логике, быть не должно. Возможно, это объясняются аномалиями порчи бюллетеней (процент их получился больший, чем ожидалось), либо ошибками/флуктуациями переноса 2% недействительных бюллетеней на 100% явки .
3. Относительный % роста вброса от явки начинается от 45% и примерно линейно увеличивается с ростом показанной явки.
4. Кривая распределения после вброса в начальной своей части неожиданно легла почти точно на 5% правее исходной (смотри соответствие с тонкой чёрной сдвинутой гауссианой). Это крайне важный факт, который мы специально обсудим позже. 
Previous post Next post
Up