Провёл ночь за увлекательным занятием: написал черновую версию скрипта для выкачивания результатов выборов с сайта ЦИК по отдельно взятому региону (взял Москву). Сделал краткий анализ.
Вначале проанализровал результаты президентских выборов. Есть подозрительные корреляции процентов за Путина, которые отличаются по знаку от аналогичных закономерностей для всех остальных кандидатов: 1) с отношением полученных бюллетеней к числу избирателей по списку, 2) с процентом бюллетеней, выданных вне помещения, 3) с явкой, 4) с процентом недействительных бюллетеней, 5) с отношением числа полученных открепительных к числу избирателей по списку, 6) с долей проголосовавших по открепительным.
Всё это позволяет предположить наличие каруселей, но возможен и аргумент, который невозможно опровергнуть чисто статистически: дескать, при повышении явки приходят только люди за Путина (и по открепительным проявляют желание голосовать они же). Причём если выбирать участки со списочной численностью от 1000 человек, эти закономерности ослабевают, что позволяет задаться вопросом о том, не являются ли они артефактом.
Я выкачал также результаты думских выборов в декабре и связал их с результатами президентских по номеру УИК. Число избирателей по спискам возросло на 99103 человека. Из-за снижения явки число проголосовавших уменьшилось на 188065 человек. Однако при этом число бюллетеней в станционарных урнах уменьшилось на 207881 тыс., а вот в переносных - наоборот, возросло на 31799. Число выданных открепительных увеличилось на 33430, а число проголосовавших по ним, по сравнению с декабрем, возросло на 43684 человека.
Чтобы проверить наличие манипуляций с дополнительными списками, я рассчитал по каждому участку разницу между численностью избирателей в декабре и в марте, но она не связана значимо в целом по Москве ни с процентом голосов за ЕдРо в декабре, ни с процентом голосов за Путина в марте.
Чтобы проверить наличие "подрисовок", я проверил хи-квадратом, отличается ли статистически значимо распределение последних цифр в количестве проголосовавших за Путина, от равномерного. В целом по Москве отличия нет, но если брать участки с явкой более 90%, оно становится достоверным (т.е., возможно, что на части таких участков цифры рисовали произвольно). К счастью, доля таких участков очень мала.
В общем и целом, на поверхности ничего нет. Вероятно, алгоритмы фальсификации отличались от ТИКа к ТИКу (о чём можно предположить, глядя на принципиально различный характер закономерностей в разных районах) - надо строить многоуровневую модель. Также, можно предположить, что в целом в Москве, давшей наиболее низкий по стране результат за Путина и где было по несколько наблюдателей на каждом участке, доля фальсификаций (особенно грубых, которые легко выявить статистически) была относительно невысока. Надо провести аналогичный анализ для других регионов.
Мой файл с данными, если кому интересно, можно
скачать тут (Переменные обозначены: D...- думские выборы, P...-президентские, DF...-разница президентские минус думские. Вначале в каждой группе идёт 18 переменных, соответствующих строкам протокола, затем 8 моих переменных с подсчитанными соотношениями, и далее количество и процент голосов за каждого кандидата). Не забудьте отключить УИК № 3182, где все бюллетени признали недействительными.