ВременнЫе диаграммы

Sep 10, 2013 14:27

Originally posted by oude_rus at ВременнЫе диаграммы
Я вообще люблю всякие динамические процессы, а тут anderson_mike предложил посмотреть на динамики процентов кандидатов -- т.е. как они менялись по времени обнародования данных на официальном сайте ЦИК. shipilev сделал отличную бродилку, которая собирала данные с сайта ЦИК и представляла их в форме удобоваримых таблиц (за что ему огромное спасибо). Вот тут представлены результаты эксперимента  anderson_mike в качестве таблицы; я же их просто визуализую. Сразу предупрежу, что пунктирные линии - это не более чем для обозначения соответствия точек; никаких изменений вдоль линий не происходило.


По горизонтальной оси - время от закрытия участков. Как видно, первое обновление с 3.5% голосов прошло уже через 2.5 часа, и именно из этих данных появилась явка в 35%, собянинский результат в 56%, и навальновский в 23%. Еще через 2.5 часа последовало следующее обновление, где учитывались 32% голосов и явка уже стала 32.4%, Собянин набрал 52.7%, а Навальный - 26.2%. Это вполне объяснимо, поскольку первыми отрапортовались всякие полузакрытые учреждения, которые традиционно голосуют за власть. Следующее обновление следует через 2 часа, учитывает 70% голосов и изменяет результаты кандидатов на 1% в те же стороны.

А потом следует пауза на 8 часов, после которой публикуются официальные данные, которые меняют результаты на какие-то вшивые две десятых процента.

Интересно, зачем была нужна эта пауза, и что в ее течении происходило.

Понятно, что вы мне сейчас скажете, что по мере увеличения выборки среднее стремится в его истинному значению, и, понятно, что я соглашусь, что именно так и должно быть. Вот только стремится-то оно не случайным, а вполне закономерным образом. Мой опыт работы с молекулярными системами говорит мне, что должен быть систематический процесс, который изменяет среднее по мере накопления статистики. Что будет аналогом подобного процесса в этом случае? Начальное сильно-нерепрезентативное отклонение?

Ну и в качестве бонуса -- те же данные, только вид сбоку: результат кандидатов как функция от доли посчитанных голосов:


UPD Прозорливый barouh предложил, а любезный shipilev посчитал разницу между результатами дампов данных, т.е. какой именно результат получен в выборке с, например, 5:00 до 6:30. Таким образом, удалось избавится от эффекта памяти, т.е. когда предыдущая (особенно первая) точка влияет на последующие результаты. Новые точки показаны открытыми кружочками, и таки да, я готов, наверное, согласиться, что разброс точек вокруг среднего значения более-менее случаен (точнее, я не возьмусь доказать, что отклонения выпадают из случайного тренда за исключением первой точки, которую уже обсудили).

Но тут возникает вот какой забавный сценарий. Посмотрите на Собянинские результаты с точки зрения избиркома: за четыре первых же часа каждые 10% посчитанных данных понижают результат Собянина на 1%! И таким жизнерадостным образом тренд доезжает до 50.3%, а впереди еще 35% необработанных данных, т.е. верных минус 3%. На горизонте уже маячат 47% за Собянина... вот чтоб бы сделали в такой ситуации? правильно, приостановили бы разглашение новых данных, пока сами не убедитесь в переломе тренда. Даже наплевав на все обещания сообщить результаты уже в день выборов. Страшно же!

Не, anderson_mike - это голова. Не догнали, так хоть согрелись!

UPD2 По просьбе afrikanbo (который "диссеррубка") добавил остальных кандидатов. Ну, у них первая же выборка попала в цель, что говорит о том, что они никому неинтересны ... а о чем это говорит?

фальсификации, выборы по-путински, москва

Previous post Next post
Up