24.11.2015 02:34
Оригинал взят у
realistromantic в
Голосование по Войковской: работает ли демократия? В интернете публиковались данные о ходе голосования по переименованию Войковской. Сомнения понятны: все хотят убедиться, что голосование проводится честно, без накруток. В последнее время к критике голосования
подключилась «тяжёлая артиллерия» в лице «Эха Москвы», а организаторы голосования дали обещание организовать возможность
убедиться, что голосование проведено как положено.
Поскольку доказывать, что голосование проведено как положено, пост-фактум, если не было независимых наблюдателей возле самой машинки подсчёта («прозрачная урна») и без раскрытия всех имён проголосовавших, затруднительно, считаю уместным провести некоторый поверхностный анализ хода голосования. Достаточный, чтобы распознать типичные способы накрутки.
Основные «интриги», побудившие к настоящему анализу, следующие:
- Партия «за» (за переименование) предельно недоумевает и считает, что ответ «против» настолько абсурден, что никто его выбирать не будет. Но видит, что результаты как раз в пользу партии «против».
- Партия «против», поймав партию «за» за руку на фальшивках, начинает сомневаться, может, партия «за» еще и счётчик накручивает?
- Многие наблюдатели (из обеих партий) удивляются тому, что ход голосования идет «слишком равномерно»: идут споры, голосует огромное количество людей, а проценты почти не меняются.
К сожалению, подробные данные можно получить только начиная с 13.11.2015, когда на сайте «Активный Гражданин» стали указываться точные количество голосов по каждому варианту ответа. Думаю, это потеря существенная, но не фатальная: с 13 по 22 ноября было отдано достаточно голосов, чтобы уже только по одному этому периоду понять, что происходит и за что голосуют. До начала периода уже было отдано 270 тысяч голосов с долями «за» и «против» соответственно 34.5% и 53.2%. В течение периода было отдано 33 тысячи голосов с долями «за» и «против» соответственно 35.7% и 51.9%. Разница в процентах статистически значимая, но, с точки зрения результатов голосования, непринципиальная. Поэтому период можно считать репрезентативным, а значит, самодостаточным для анализа.
На графике (вверху поста) показаны средние за 4-часовые интервалы проценты голосов по всем четырём партиям - «за», «против», «затрудняюсь ответить», «пусть решают специалисты». Проценты указываются с их статистическими погрешностями (оцениваемыми по уровню «одна сигма» как sqrt(n*(N-n)/N)/N). 4-часовой интервал выбран как компромисс между точностью в измерении процентов и точностью в разрешении по времени. Погрешности в ночные интервалы выше, потому что им соответствует меньшее количество голосов.
Видно, что есть существенные нерегулярные колебания в значениях процентов. Это говорит о том, что среднее мнение голосовавших действительно менялось. Скорее всего, люди с разными представлениями по вопросу откликались на разные события в медиа.
По крайней мере, наблюдаемый разброс позволяет отвергнуть гипотезу о том, что был какой-то заранее заданный процент, который искусственно поддерживался организаторами, вне зависимости от реальных голосов. Показанные величины погрешностей соответствуют равномерному потоку совершенно случайных (независящих друг от друга) голосов. Если бы поток был фиксирован устроителями, то разброс значений между интервалами был бы намного меньше величины погрешности. Мы же видим, что разброс больше, а значит, доля не только не зафиксирована, но и подвержена каким-то внешним воздействиям.
На этом графике сопоставлено, как совместно менялись голоса «за» (по горизонтали) и «против» (по вертикали). Здесь время не показано: каждый час - это крестик на графике. График идет слева снизу (меньше голосов, начало периода) вправо вверх (больше голосов, конец периода). Здесь мы также видим, что соотношение «за» и «против» (проявляющееся как наклон кривой) немного «плавает», т.е. есть какие-то внешние причины, влияющие на баланс «за» и «против».
Особо отмечу «ночные остановки». Видно, что наклон там тоже не меняется: просто замедляется ход «за» и «против». Это позволяет отвергнуть гипотезу о «тупой накрутке», которая работает равномерно: она не останавливалась бы ночью, что неизбежно бы проявилось как излом кривой голосования в соответствующую сторону. Поскольку кривая идет «ровно», можно делать вывод, что партии «за» и «против» отходят ко сну и ложатся спать одинаково.
Мы видим особое поведение в конце: сначала голосование заметно смещается в пользу партии «против», затем - резко (крестики идут реже - значит, голоса отдаются быстрее) - в пользу партии «за». (Подробнее об этом скачке см. в
других источниках.) Что ж, это естественно для живых голосований. К сожалению, подробно проверить, была ли накрутка именно в этот момент, нашими методами почти невозможно. Понятно, однако, из общего наклона, что если в этот момент накрутка и была, то её роль невелика.
Кстати, если остановиться перед началом этих скачков в конце, на уровне, когда «против» было 158000 голосов, получаем средние с начала периода проценты голосов: 35.5% «за» и 51.5% «против». А за сам этот «хвостик» - 37.1% «за» и 54.3% «против». Можно предположить, что под конец обе партии активизировались за счет безразличных. Подробный анализ доли безразличных выходит за рамки нашего интереса.
И, совсем на десерт, такая картинка:
Здесь каждая точка показывает количество голосов, отданных в течении одного часа: по горизонтали - «за», по вертикали - «против». Несколько точек из скачка в конце голосования «вылетело» за пределы графика. Мы еще раз видим, что в области околонулевых скоростей голосования точки кучкуются примерно вдоль зеленой прямой: «спят» обе партии одновременно. Однако в области больших скоростей голосования точки явно смещаются вправо (условно, вдоль синей кривой: кривая проведена только для иллюстрации и не претендует на раскрытие каких-то тайных процессов). Видимо, так работает избирательная стимуляция партии «за». Судя по графикам хода голосования (здесь не приводятся, т.к. приводились в других работах, например, в связи с
тем же скачком), эта стимуляция всё равно увеличивает как голоса «за», так и голоса «против» (просто голоса «за» увеличиваются сильнее).
Полагаю, что проанализированные данные позволяют:
- отвергнуть предположения о простейших накрутках;
- предложить в качестве объяснения кажущегося «вкопанного процента» два фактора:
- число голосов уже довольно большое, и поэтому статистический шум невелик (это достаточная причина);
- фактор, разделяющий людей по принципу «за» и «против», слабо связан с большинством внешних факторов, таких как время голосования, внимание к СМИ и т.п. Поэтому, условно говоря, когда Киселёв разжигает истерику «Войков - убийца», люди тянутся к кнопке - и голосуют, но не как их « заакционизмировал» телеведущий, а так, как считают нужным.
Думаю, наблюдаемую стабильность числа голосов: слабую зависимость от длительности голосования, от медиавбросов и иных стимуляций, - можно считать признаком успеха нашего общества на пути демократии. Результаты показывают именно мнение людей, имеющих доступ к голосованию на «активном гражданине».
P.S. Благодарю ребят, мониторивших ход голосования, за предоставленные данные.