Немного тестируемости (исключительно для фриков)

Dec 07, 2011 12:21

В комментариях было высказано предположение, что пики на 5-кратных процентах могут быть связаны с квантанизацией человеков. Ну, мы все в детстве смеялись над двумя землекопами и две трети. То есть, если на участке голосует 20 человек, то любой исход будет обязан быть кратным 5. Я это проверил путем( Read more... )

Leave a comment

Comments 18

ожидание a_shen December 7 2011, 11:27:35 UTC
кратных пяти чисел в частном соответствует столь же необъяснимому ожиданию делителей 20 в знаменателе (а чем уж так они выделяются? почему не 21 или 24)? то есть это, imho, можно было бы и не проверять, а отвергнуть из чисто статистических соображений...

Reply

Re: ожидание podmoskovnik December 7 2011, 17:33:08 UTC
На самом деле некие особенности типа функции Римана на гистограмме большого набора случайных рациональных чисел с ограниченным знаменателем действительно должны быть, но в нашем случае они не такого размера.

Reply

должны быть, a_shen December 7 2011, 18:14:02 UTC
но не именно на кратных пяти и десяти - это уж особенности десятичной системы, которые в неискажённых данных не должны проявляться

Reply

Re: должны быть, podmoskovnik December 7 2011, 19:04:10 UTC
Да, конечно.

Reply


kobak December 7 2011, 11:29:51 UTC
Красиво было бы посчитать спектр -- должен быть явный пик на гармонике 5%. Интересно, достаточно ли данных для этого анализа в отдельных регионах: можно было бы посмотреть на размер этой гармоники по каждому региону.

И еще было бы любопытно проделать кластерный анализ на двумерных картинках по каждому региону по отдельности -- как Вы сделали для Москвы. На общем графике по стране никаких кластеров не видно, но это может быть потому, что "вторичные" кластеры разных регионов сливаются в общий "хвост". Было бы интересно посмотреть.

Я могу сделать и то, и другое, но, наверное, не раньше, чем завтра.

Reply

oude_rus December 7 2011, 11:39:14 UTC
разумеется, и на кратных частотах тоже. Только видно это так себе из-за большой компоненты на нулевой частоте.

На общей картине кластеров действительно нет. Частично это связано с различными паттернами кластеризациии -- например, я смотрел СП, так тоже 2 фокуса, но на одной явке. Но это огромная работа, а зачем все это делать, не очень понятно.

Reply

kobak December 7 2011, 11:56:08 UTC
А какая разница, что там на нулевой частоте? Не очень понял, но я попробую посчитать и посмотрю, что получается.

А про кластеры -- ну смотреть на 90 регионов по отдельности мне тоже неохота, но можно на каждую картинку напустить кластерный анализ и получить результаты автоматически. По крайней мере можно попытаться.

Reply

oude_rus December 7 2011, 13:23:03 UTC
ну да, для этого нужны данные по отдельным регионам.

Reply


anonymous December 7 2011, 12:57:19 UTC
99/200 на участке с <100 человек получить нереально.
нет рациональной дроби, которая туда округляется.
Должны быть еще всякие закономерности из той же оперы....

Интересно бы посмотреть на эти данные в неокругленном виде.

Sean.

Reply


green_fr December 7 2011, 13:40:39 UTC
Шикарно, спасибо!

Reply


alar563 December 13 2011, 06:51:34 UTC
Очень интересно.
Еще интересней посмотреть последний график для УИК с числом избирателей 100-500, 500-1000 и т.д.

Reply


Leave a comment

Up