Здравствуйте! Вы пишете: "Чтобы количественно проверить насколько правильно ведут себя флуктуации числа голосов, можно рассмотреть такую величину ("показатель дёргания"): si=(di+1−di)2 / (di+1+di), где di -- величины соседних приростов голосов. Среднее этой величины в теории равно 1"
"Среднее этой величины в теории равно 1" - откуда вы взяли это? Достаточно увеличить в 2 раза все значения di, чтобы значения si из этого списка также увеличились в 2 раза. Таким образом, при увеличении di и si тоже увеличивается, и вряд ли будет близко к единице для любых процессов.
Ваш график ничего не поясняет, он только может свидетельствовать о том, что у этих двух процессов разный масштаб. Если вы разделите данные si по второму процессу (голосование по промилле) на среднее значение (которое находится где-то около 4-5, наверное), то получится график, схожий с графиком по голосованию за инициативу Навального.
Вопрос: вы можете дополнительно дать график не "показателя дергания" si, а самих значений di? Если можно, два графика (по этим двум разным голосованиям) на одной шкале, чтобы можно было бы сравнить.
И еще такой небольшой вопрос: что означает 1:6 на ваших графиках в правом верхнем углу?
> "Среднее этой величины в теории равно 1" - откуда вы взяли это?
Я численно посчитал, что для случайных величин d_1, d_2, которые должны получаться, если люди приходят независимо друг от друга в случайные моменты времени с постоянным средним потоком людей, получается 1. Точнее, 1 с точностью не хуже 0,001 -- а лучше тут и не требуется.
> Достаточно увеличить в 2 раза все значения di, чтобы значения si из этого списка также увеличились в 2 раза. Таким образом, при увеличении di и si тоже увеличивается, и вряд ли будет близко к единице для любых процессов.
Для процесса прихода людей независимо друг от друга разброс значений d_i пропорционален корню из среднего значения -- это известно из тервера. Так что если будет приходить в 2 раза больше, разброс должен увеличиться только в 1,4... раза. Что для любых процессов будет 1 я не говорю, только если приходят независимо друг от друга. Если за 10 минут будет приходить одинаковое число, показатель будет 0, а если всегда приходить будут парами (что эквиватентно удвоению d_i), будет 2. Но это не выглядит как настоящее голосование, т.к. люди в разных местах не имеют возможности скоординироваться, чтобы как-то одновременно или, наоборот, равномерно голосовать.
1:6 -- это номера столбцов из файла, которые откладываются по x и по у. Т.е., фактически, это ничего не значит кроме того, что я поленился более разумные подписи поставить.
Вы пишете:
"Чтобы количественно проверить насколько правильно ведут себя флуктуации числа голосов, можно рассмотреть такую величину ("показатель дёргания"):
si=(di+1−di)2 / (di+1+di),
где di -- величины соседних приростов голосов. Среднее этой величины в теории равно 1"
"Среднее этой величины в теории равно 1" - откуда вы взяли это?
Достаточно увеличить в 2 раза все значения di, чтобы значения si из этого списка также увеличились в 2 раза. Таким образом, при увеличении di и si тоже увеличивается, и вряд ли будет близко к единице для любых процессов.
Ваш график ничего не поясняет, он только может свидетельствовать о том, что у этих двух процессов разный масштаб. Если вы разделите данные si по второму процессу (голосование по промилле) на среднее значение (которое находится где-то около 4-5, наверное), то получится график, схожий с графиком по голосованию за инициативу Навального.
Вопрос: вы можете дополнительно дать график не "показателя дергания" si, а самих значений di? Если можно, два графика (по этим двум разным голосованиям) на одной шкале, чтобы можно было бы сравнить.
И еще такой небольшой вопрос: что означает 1:6 на ваших графиках в правом верхнем углу?
Reply
Я численно посчитал, что для случайных величин d_1, d_2, которые должны получаться, если люди приходят независимо друг от друга в случайные моменты времени с постоянным средним потоком людей, получается 1. Точнее, 1 с точностью не хуже 0,001 -- а лучше тут и не требуется.
> Достаточно увеличить в 2 раза все значения di, чтобы значения si из этого списка также увеличились в 2 раза. Таким образом, при увеличении di и si тоже увеличивается, и вряд ли будет близко к единице для любых процессов.
Для процесса прихода людей независимо друг от друга разброс значений d_i пропорционален корню из среднего значения -- это известно из тервера. Так что если будет приходить в 2 раза больше, разброс должен увеличиться только в 1,4... раза. Что для любых процессов будет 1 я не говорю, только если приходят независимо друг от друга. Если за 10 минут будет приходить одинаковое число, показатель будет 0, а если всегда приходить будут парами (что эквиватентно удвоению d_i), будет 2. Но это не выглядит как настоящее голосование, т.к. люди в разных местах не имеют возможности скоординироваться, чтобы как-то одновременно или, наоборот, равномерно голосовать.
Графики d_i можно посмотреть тут: http://roi.f1p.net/ , http://habrahabr.ru/post/181315/ , http://leonwolf.livejournal.com/497261.html . Столбики идут примерно раз в час, имеют высоту 15...50, поэтому при просмотре надо выбирать соответствующий масштаб, чтобы их было видно.
1:6 -- это номера столбцов из файла, которые откладываются по x и по у. Т.е., фактически, это ничего не значит кроме того, что я поленился более разумные подписи поставить.
Reply
Leave a comment