Статистический анализ результатов выборов президента Украины в 2014 году

Jun 01, 2014 15:55

Для анализа были взяты данные с сайта ЦИК Украины http://www.cvk.gov.ua/vp2014 . При этом мной не были учтены данные голосования по заграничным округам, так как количество проголосовавших там мало по сравнению с общим числом, так что вклад в результат минимален, а распределение обычно ( Read more... )

Выборы, Текущая политика

Leave a comment

Comments 38

assargaddon June 4 2014, 04:50:32 UTC
На Гаусса здесь так же непохоже

Я вот смотрю - и вижу чистый гаусс, плюс много участков, на которых нулевая явка. Вроде бы так и должно быть, разве нет? Это хорошо согласуется с провалами явки в Донецкой и Луганской областях на диаграмме ниже.

P.S. В чём измеряется frequency? Это абсолютное количество?

Reply

uborshizzza June 4 2014, 05:42:45 UTC
"В чём измеряется frequency? Это абсолютное количество?" - да

"Пилу Чурова" по Украине получить невозможно просто из-за отсутствия детализированных данных. Но с явкой есть другая очень неприятная особенность - малые разбросы. В каждой из областей по всем избирательным округам данные по явке были очень близки друг к другу, тогда как в областях, в том числе соседних, отличались значительно больше. Гипотеза о том, что внутри области все люди очень похожи друг на друга, а в разных областях живут разные, кажется маловероятной

Reply

assargaddon June 4 2014, 06:50:59 UTC
Я пока такой закономерности не вижу. Это не означает, что её нет, просто я её пока не вижу - а вы не приводите более подробный анализ.

Ну и, как мы уже выяснили, данные по участкам - есть.
Так что пилу найти - если она есть - можно.

Проблема с пилой в том, что она у вас идёт первой картинкой в посте. Поэтому, когда люди делают перепост, именно пила появляется в качестве иллюстрации. В сочетании с заголовком это выглядит так, как будто вы обнаружили пилу на украинских выборах. Из текста ясно, что это не так, но при беглом просмотре...

Reply


assargaddon June 4 2014, 05:45:56 UTC
Сильным аргументов в пользу того, что на думских выборах в России были вбросы, явилась неожиданная регрессионная связь явки и результатов голосования.
...
То есть те соотношения, которые в думских выборах были приняты как доказательства вбросов в пользу ЕР, на выборах на Украине тоже наблюдались в пользу Порошенко, Тимошенко, Ляшко и Тягнибока.

В статье АБСОЛЮТНО не показано наличие регресионной связи между явкой и итогами. Не показано ВООБЩЕ. Для этого надо было бы посчитать корелляцию. Она не подсчитана ВООБЩЕ.

Беря два каких угодно несвязанных процесса, вы всегда получите какие-нибудь регресионные коэфициенты. Их величина не доказывает ничего, пока не показано, что между ними есть корелляция. Это же азы.

Reply

uborshizzza June 4 2014, 06:44:51 UTC
Как это не подсчитана регрессионная связь, если даже таблица с регрессионными коэффициентами приведена?

То, что регрессионный коэффициент больше средней доли, и означает, что имеется положительная корреляция между явкой и долей за данного кандидата. Давать и те, и другие данные в исходных числах - перетежелять статью для тех, кто математику не знает, тогда как математикам и так все понятно.

Вас интересуют величины корреляций? Никаких проблем, возьмите данные с сайта ЦИК и посчитайте.

Reply

assargaddon June 4 2014, 07:01:08 UTC
То, что регрессионный коэффициент больше средней доли, и означает, что имеется положительная корреляция между явкой и долей за данного кандидата.

Да. Только 0.000001 - это тоже положительная корелляция.

Как это не подсчитана регрессионная связь, если даже таблица с регрессионными коэффициентами приведена?

Понимаете, для любых наперёд заданных регресионных коэффициентов можно с лёгкостью построить последовательность (в пару к имеющейся) со сколь угодно малой (но ненулевой) корелляцией.

Упрощенно говоря: есть две последовательности. Частично они связаны, частично - случайны. Регресионные коэффициенты показывают, как они связаны, но не показывают - насколько. Корелляция же показывает - насколько вторая последовательность описывается закономерной зависимостью от первой, а насколько - случайностью.

Reply

uborshizzza June 4 2014, 07:17:28 UTC
А кто спорит? Я ведь немного о другом, о том, что это я не включил из-за того, что статья для большинства читателей и так слишком тяжелая.

Постараюсь в ближайшие дни проанализировать исходные данные по участкам. Соответственно выложу и исходники. Пока, к сожалению, работа малость задавила

Reply


assargaddon June 4 2014, 06:33:51 UTC
В общем, если кому-то настолько интересно увидеть достоверный анализ такого типа - напишите мне. Я могу и даже хочу его сделать, но для этого надо слить воедино около 200 таблиц (по штуке на окружную комиссию), чтобы получить единую таблицу с результатами по всем участкам. В одиночку это слишком долго и трудозатратно.

uborshizzza, вы как насчёт скооперироваться?

Reply

uborshizzza June 4 2014, 18:17:42 UTC
Я пока не совсем определился с планами, но если будет что-то, я скину исходники

Reply


pansar June 5 2014, 10:20:30 UTC
Спасибо, интересно. Было бы здОрово, если бы вы выложили исходники. Первая гистограмма по Украине -- там настолько явный провал в центре из-за выбраного bin size, график плотности (aka kernel density) был бы полезнее. Также было бы хорошо посмотреть на p-values или стандартное отклонение для коэффицентов в регрессионной таблице -- без этого ценность таблицы довольно сомнительна.

Reply

uborshizzza June 9 2014, 15:39:41 UTC
Исходники выложил, причем на уровне избирательных участков. Посмотрите мои следующие посты по этому тагу, там есть ссылка

Reply

pansar June 11 2014, 10:07:05 UTC
Спасибо, скачал. покопаю данные позже.

Reply


romanik June 9 2014, 15:05:45 UTC
"К сожалению, на сайте ЦИК Украины были представлены данные не по избирательным участкам, а по округам"

Горе-исследователь, который не может найти данных по УИКам на сайте ЦИКа Украины... И зачем дальше читать. Читайте нормальных людей. http://abuzin.livejournal.com/141176.html

Reply

uborshizzza June 9 2014, 15:38:50 UTC
А еще можно посмотреть мои посты за следующие дни, тоже отмеченные тагом "Выборы" - там анализ по найденным данным по избирательным участкам

Reply

uborshizzza June 9 2014, 17:39:46 UTC
Горе-читатель, который не в состоянии найти последующие посты с подробным анализом по участкам. Когда делался этот пост, результатов еще не было.

Столько у всех гонора - жуть просто.

Reply

romanik June 10 2014, 05:46:20 UTC
Гонор - он у тех, кто считают, что они единственные в Интернете и другим больше делать нечего, как "искать последующие посты". Тем более посты человека, с такими грубыми ошибками. Кстати, есть у вас update с признанием ошибки? Со ссылкой на "последующие посты"?

Меньше гонора, уважаемый! :)

Reply


Leave a comment

Up