Статистический анализ выборов президента России 2012. Томск (Кировская)

Mar 05, 2012 23:09


В верхнее тематическое оглавление

Тематическое оглавление (Политика)

Так как в дискуссию о статистическом анализе результатов выборов включились новые уважаемые читатели, не поднаторевшие на результатах прошлых кампаний, а время сейчас уже какое-то есть, то я, если можно, проведу несколько более расширенный анализ и выложу его с комментариями. В качестве объекта возьму г. Томск (Кировская), всего там 4 подразделения, так как было пожелание учесть именно этот город.

Первое, с чего начинается анализ - это с распределения по явке. В данном случае она выглядит так:




Не Гаусс, конечно, но не так уж и далеко от него.
Основная гипотеза, которая проверяется - что на разных участках имеется разное количество голосов, приписанных «кому надо». Альтернативная (нулевая) гипотеза - что различий нет.

В случае совсем четкого выполнения нулевой гипотезы должны были бы выполняться следующие закономерности:

Вариация доли голосов, поданных в соседних участках за одного кандидата, должна быть небольшой. При этом чем больше голосов за кандидата, тем меньше вариабельность (коэффициент вариации - отношение среднеквадратичного отклонения к среднему арифметическому),

Доля голосов, поданная за кандидата, не должна зависеть от явки. В частности, если считать, что число явившихся на тот или иной участок - это N, а число голосов, отданных за кандидата Бесподобного - это Б, то они должны быть связаны соотношением Б=BN. Такое соотношение должно быть и для других кандидатов, только с другими величинами коэффициента В.

Социологические поправки говорят, что это - не совсем так. То есть распределение по явке может быть значительно более вариабельным и не вполне нормальным, так как явка или неявка людей на выборы - не совсем независимые события, и, скажем, семьи делают это относительно согласованно.

Аналогично и степень лени и согласованности выбора при голосовании за кандидата-лидера и кандидата-аутсайдера тоже могут несколько различаться, что приводит к отличиям от закона Б=BN, но каких-то особо кардинальных отхождений не будет.

Если же считать, что имели место «добавления» голосов за кого надо, причем они были массированными и разной степени интенсивности, то будет наблюдаться следующие закономерности:

Значительно больший разброс в явке по разным участкам и большая «негауссовость» распределения,
Разброс голосов за «кого надо» будет значительно больше, чем за других,
Будет иметься положительная зависимость голосов, поданных «за кого надо», от явки.

Более наглядно последний эффект проявляется, если брать голоса, поданные за претендента, в процентах не от доли явившихся, а от доли общей численности избирателей участка.
В этом случае вместо зависимости Б=BN для кандидата от «партии власти» зависимость будет Б=с+N, то есть коэффициент В=1, и появляется первый член в уравнении линейной регрессии, а для всех остальных кандидатов зависимость будет Б=с, то есть доля поданных за него (в процентах от численности избирателей на участке) вообще не зависит от явки на участок.

Разумеется, на все эти закономерности накладывается случайный шум, но выявление прямолинейной тенденции - стандартная задача для математической статистики.

В рассмотренном случае для параметров голосов, поданных за разных претендентов (их фамилии сокращены, но понятно), имеем следующее:


Таким образом, в данном случае единственное, к чему можно прицепиться - это слишком большой коэффициент эксцентриситета, равный 10, для голосов за Путина. Но мало ли…

Сама картинка имеет следующий вид:


То есть в данном случае точки достаточно хорошо лежат на прямой линии, выходящей из центра координат, что соответствует нулевой гипотезе об отсутствии значимых фальсификаций.

Построенные уравнения регрессии зависимости доли голосов, поданных за претендента, от явки тоже подтверждают это наблюдение:


Т.о. можно поздравить население г. Томска (Кировская) и, особенно - членов УИКов и доблестных наблюдателей за честную работы.

Выборы, Текущая политика

Previous post Next post
Up