a-kruglov пишет о фальсификации голосов на сайте РОИ. Там много математики и даже мне не очень понятно до конца, поэтому я решил сам посмотреть что там и как.
Для этого я взял немного другой матаппарат,
автокорреляционную функцию. Считать стал от количества голосовавших в "данный момент", (т.е. разницы в голосах между моментом времени и 10 минутами назад
(
Read more... )
Может, вот анализ данных до 23 мая
Вот после
Пик на втором графике тоже есть, но он маленький.
Волков утверждал, что если бы сохранялся коэффициент отношения "промилле" к "Навальному", то получился бы такой же результат, если посмотреть на график и срезать аномальные пики. Можно ли как-нибудь это утверждение формально проверить?
Можно попробовать. Я фильтровал пики по принципу "Если в 16 раз больше, чем полусумма соседних, то считаем вбросом". Фильтровал оба графика. Вот график отношения проголосовавших как есть:
а вот с отфильтрованными пиками
То есть, если отфильтровать пики то всё равно было три момента, когда инициатива "Промилле" догоняла "Навального", так что leonwolf не совсем прав. Вероятно, люди шли повторно на сайт и "доголосовывали" за что нибудь ещё :-)
Reply
А это отношения между голосовавшими с самого начала или за единицу времени?
В любом случае видно, что график становиться гораздо горизонтальней после выбрасывания пиков, так что Волков скорее прав.
А можно посмотреть время на горизонтальной оси?
Reply
Вот, держите такой график. По оси отложено отношение количество голосующих за каждую из инициатив в сутки. Синяя кривая - как есть, зелёная, красная и фиолетовая - применён фильтр удаления "пиков" (разной мощности). Он применён к обоим стат данным одинаковый. То есть, если у "Автомобилей" был "честный" пик, то он посчитает его вбросом :-)
Что мы тут видим?
Во-первых, графики скачут, и прямой линии тут нет.
Во-вторых, чем сильнее режем пики, тем более это на пользу Навальному.
Во-третьих, всё-таки есть места где график выше единицы (набор за промилле шел быстрее, чем за авто), даже при самой сильной фильтрации. Таких мест всего два, это 14.05 и 25.05, но зато и набор голосов в них был самым большим. Условно, пять дней Маня таскала по ведрышку, а Таня по полвёдрышка из колодца, а на шестой день Маня принесла десять вёдер, а Таня тринадцать.
Reply
Leave a comment