Фальсификация голосования на сайте РОИ

May 31, 2013 14:48

a-kruglov пишет о фальсификации голосов на сайте РОИ. Там много математики и даже мне не очень понятно до конца, поэтому я решил сам посмотреть что там и как.

Для этого я взял немного другой матаппарат, автокорреляционную функцию. Считать стал от количества голосовавших в "данный момент", (т.е. разницы в голосах между моментом времени и 10 минутами назад ( Read more... )

Leave a comment

vladimirovich June 1 2013, 14:32:02 UTC
может ли ваш анализ проверить гипотезу, что вбросы перекатились (или стали более размазанными) после 23 мая?

Может, вот анализ данных до 23 мая



Вот после



Пик на втором графике тоже есть, но он маленький.

Волков утверждал, что если бы сохранялся коэффициент отношения "промилле" к "Навальному", то получился бы такой же результат, если посмотреть на график и срезать аномальные пики. Можно ли как-нибудь это утверждение формально проверить?

Можно попробовать. Я фильтровал пики по принципу "Если в 16 раз больше, чем полусумма соседних, то считаем вбросом". Фильтровал оба графика. Вот график отношения проголосовавших как есть:



а вот с отфильтрованными пиками



То есть, если отфильтровать пики то всё равно было три момента, когда инициатива "Промилле" догоняла "Навального", так что leonwolf не совсем прав. Вероятно, люди шли повторно на сайт и "доголосовывали" за что нибудь ещё :-)

Reply

pupugai June 1 2013, 15:19:53 UTC
Интересно!
А это отношения между голосовавшими с самого начала или за единицу времени?
В любом случае видно, что график становиться гораздо горизонтальней после выбрасывания пиков, так что Волков скорее прав.
А можно посмотреть время на горизонтальной оси?

Reply

vladimirovich June 1 2013, 17:06:02 UTC
Отношение "всего".

Вот, держите такой график. По оси отложено отношение количество голосующих за каждую из инициатив в сутки. Синяя кривая - как есть, зелёная, красная и фиолетовая - применён фильтр удаления "пиков" (разной мощности). Он применён к обоим стат данным одинаковый. То есть, если у "Автомобилей" был "честный" пик, то он посчитает его вбросом :-)



Что мы тут видим?

Во-первых, графики скачут, и прямой линии тут нет.

Во-вторых, чем сильнее режем пики, тем более это на пользу Навальному.

Во-третьих, всё-таки есть места где график выше единицы (набор за промилле шел быстрее, чем за авто), даже при самой сильной фильтрации. Таких мест всего два, это 14.05 и 25.05, но зато и набор голосов в них был самым большим. Условно, пять дней Маня таскала по ведрышку, а Таня по полвёдрышка из колодца, а на шестой день Маня принесла десять вёдер, а Таня тринадцать.

Reply


Leave a comment

Up