Но даже суета бывает та или не та. Вот давайте о ней и поговорим протрезвевшим от праздников сознанием.
podmoskovnik выдал
блестящую идею, обратив внимание на полезность т.н. "динамической явки", т.е. на изменение явки на каждом участке во время дня голосования. Оказывается, это явка считается несколько раз в день и официально выложена на сайте избиркома.
podmoskovnik мне любезно прислал файл данных по Нижнему Новгороду (безусловный хит нонешних выборов), который я немного покрутил с целью визуализации.
Начнем с простого: с распределений участков по явке в разное время дня:
Первая диаграмма (красный цвет) снята в 12 часов дня (т.е. сняты данные с 540 участков, диаграмму я сам по ним строил), вторая (синий) в 15 и т.д. Во-первых, видно, что распределения довольно аккуратненькие и прекрасно описываются - не побоюсь этого слова - гауссовой функцией. Со временем распределения становится шире и шире, посколько случйным событиям дается больше времени на "растаскивание" распределения. Так как сумма всех точек в распределении должна давать общее количество УИК, т.е. постоянную величину, расширение функции сопровождается уменьшением ее амплитуды. Можно довольно аккуратно определить центр распределения (т.е. наиболее вероятную явку в данное время), и отложить ее как функцию времени (график наверху). Опять-таки хорошо видно, что с утра явка меняется медленно (народ спит), к трем дня изменение явки раскочегаривается до максимальной скорости, а потом опять идет на убыль.
...пока не наступает 20 нуль-нуль, оно же время закрытия участка. Тут важно отметить, что динамическая явка, предоставляемая сайтом избиркома, ограничена 18:00, но явку на 20:00 легко вытащить из итоговых результатов -- ведь с момента закрытия участка в 20:00 протоколы не менялись, верно? Итак, в 20:00 наша красивая теория терпит крах: в распределении вдруг появляются два максимума, разнесенные процентов эдак на 28, то есть их не спутаешь. Максимум с меньшей явкой прекрасно вписывается в предыдущую теорию (см кривую наверху), а новый явно вываливается из тренда. Такое распределение, кстати, называется бимодальным, и теория говорит нам, что к нему приводят два различных фактора. Один фактор мы знаем - это обычный избиратель, а вот со вторым пока непонятно. Давайте назовем его "гиперактивным избирателем".
Чтобы понять, какова роль гиперактивного избирателя, можно использовать традиционный корреляционный анализ. Для этого я нарисовал положение каждого участка на плоскости "приращение явки за последние 2 часа" (а мы уже знаем, что есть приращение обычное, где-то на 6%, а есть - гиперактивное, аж на 33%) - процент голосов за партию (например, ЕР):
Собственно корреляция показана на средней картинке, а на двух сопроводительных - сумма всех участков с таким-то изменением явки (внизу) и суммой всех участков, которые проголосовали за партию (слева). То есть левую диаграмму мы уже видели (как вспомню, где, дам ссылку), и знаем, что она бимодальна (т.е. с двумя максимумами), но откуда они берутся, было неясно. Теперь же на корреляционной диаграмме ясно видно, что второй максимум происходит от участков с гиперактивным избирателем. Который, к слову, весьма щедр к ЕР, поскольку дает ей аж 48% заместо 31% на остальных участках.
Теперь можно сделать последний шаг. Из графика хорошо видно, что граница между нормальными и гиперактивными участками проходит по изменению явки где-то около 13% (это называется "параметр контраста"). То есть мы можем поделить все участки на обычные и гиперактивные, и изобразить их на стандарной корреляционной диаграмме %ЕР-явка:
Довольно наглядно видно, что второй кластер участков, который так щедро голосует за ЕР -- это и есть кластер гиперактивных участков. И такох участков немало - 153 из 540. Также интересно, что в гиперактивном кластере нет ни одного участка с электронным считывателем бюллетеней - КОИБ (зеленые крестики)
Разумеется, возникает вопрос: что это за гиперактивные участки такие, так благоволящие к ЕР? У меня есть теория, но я сначала хочу послушать вас. Давайте, предлагайте версии.