Продолжим предыдущую тему. В ней мы заметили явную нелинейность зависимости голосов, отданных за кандидатов от явки. Для участков оборудованных КОИБ такое явление требует объяснения.
8 сентября 2013 года одновременно с федеральными выборами (губернатор МО) проходили разнообразные местные выборы. Логично предположить, что дополнительная агитация кандидатов на местные выборные должности приведет к статистическому повышению явки избирателей.
Рис. 1. Зависимость результата двух основных кандидатов от явки. Отдельно без местных выборов и с таковыми.
Темно-синие точки и темно-красные соответствуют голосованию, совмещенному с местными выборами. Голубые и оранжевые соответствуют голосованию без местных выборов. Нелинейность, показанную в предыдущей заметке, объяснить удалось. Видно, что существовали две группы УИК, модель голосования в которых несколько различалась.
Комбинация результатов голосования этих двух групп и приводит к нелинейности на общем графике.
Несколько смущают пять голубых точек в правой части графика, явка 50% и более. Если к ним присмотреться, то все они принадлежат Солнечногорской ТИК. Внимательный взгляд на эту ТИК вызывает желание построить график без Солнечногорской ТИК.
Рис. 2. Зависимость результата двух основных кандидатов от явки. Отдельно, без местных выборов и с таковыми. Без Солнечногорской ТИК.
Совсем красота! Так и хочется сделать далеко идущие социальные выводы. Результат от явки не зависит, линии трендов параллельны оси X.
Смотрим на Солнечногорскую ТИК отдельно.
Рис. 3. Зависимость результата двух основных кандидатов от явки в Солнечногорской ТИК. Отдельно без местных выборов и с таковыми.
Этот график противоречит предыдущему. Пожалуй, прежде чем делать социальные выводы на основе Рис.2, следует понять поведение графика на Рис.3.
Еще некоторые соображения. Только на территории двух ТИК находились одновременно участки обоих типов. Только в Талдомской и Солнечногорской ТИК были как УИК с местным голосованием, так и без него. На территории остальных ТИК либо на всех УИК было местное голосование, либо оно на всех УИК отсутствовало. В Талдомской ТИК средняя явка на УИК с местным голосованием составила 38,6%, без 20,4%. В Солнечногорской ТИК разницы в средней явке практически нет. На участках с местным голосованием явка составила 38,9%, без местного голосования 37,3%.
С разницей в голосах, поданных за лидера выборной кампании, еще сложнее.
Талдомская ТИК. На участках с местным голосованием 76,1%, без местного голосования 76,7%. Нет разницы.
Солнечногорская ТИК. На участках с местным голосованием 69,1%, без местного голосования 78,7%. Результат противоположный общему тренду в разрезе ТИК.
Графики, конечно, красивые, но серьезными выводами я пока подожду. Слишком много непонятных тонкостей.
UPD. Попытка ответить
winpooh так, чтоб всем было понятно.
Уважаемый
winpooh заметил, что через такое облако точек можно провести множество линий тренда. В общем случае это так, но в нашем случае, обычная регрессия работает вполне себе хорошо. Я не буду утруждать публику сложными критериями, типа «хи квадрат» и прочей научной замороченностью, а проделаю понятное и естественное преобразование облака точек. Я пытаюсь в своих заметках изъясняться популярно.
Возьмем Рис.2. Будем двигаться по оси X слева направо и отсчитывать участки. Насчитали 20 штук подряд, подвели итог голосования по этой группе. Т.е. сложили всех зарегистрированных на 20 участках, принявших участие в голосовании, проголосовавших за кандидата. Поделив одно на другое, получим явку на этих 20 участках, и результат за кандидатов. И так по всем УИК, представленным на Рис.2. Получим результат голосования по некоторым 20 УИК, расположенных на графике близко друг к другу. Закончив с первой двадцаткой, переходим ко второй, ближайшей по ходу слева на право, и так , пока УИК не кончатся.
Преобразовав, таким образом, Рис. 2 получим:
Рис. 4. Зависимость результата кандидата лидера от явки. Отдельно, без местных выборов и с таковыми. Без Солнечногорской ТИК. Каждая точка получена путем подведения итогов на 20 УИК с близкой явкой.
Видно, что через такие точки сложно провести что-то отличное от прямой, почти параллельной оси X.
Количество проголосовавших в каждой группе УИК годится как вес точки. При проведении линий тренда вес не учитывался. Для справки, в точках синего графика содержится по 33-44 тысячи зарегистрированных избирателей. В самой правой точке около 8000, её вес маловат.
По остальным графикам тоже самое. Перед публикацией проверяю. Обычная линейная регрессия в нашем случае работает очень хорошо.
UPD2
По просьбе уважаемого
barouh выкладываю гистограммы голосования на участках с КОИБ. По оси X явка, по оси Y количество проголосовавших в бине 2%.
Рис. 5. Участки, на которых местные выборы были совмещены с федеральными.
Всё относительно ровнёхонько. Отдельные пики с явкой выше 60% на территории Можайской ТИК. Есть некие подозрения по поводу явки выше 70%. Можайская ТИК, как уже говорилось, показала самую высокую явку среди ТИК с КОИБ.
Рис. 6. Участки, на которых местных выборов не проводилось.
Здесь есть неприятности. Все пять пиков с явкой 50% и выше находятся на территории Солнечногорской ТИК. Один участок маленький, больница. Оставшиеся четыре вызывают подозрения.
Горбик в районе 40% так же обеспечен Солнечногорской ТИК. Только три участка в этой области не принадлежат Солнечногорской ТИК. Два из них это закрытые территориальные образования.
Склоняюсь к тому, что местные выборы
- почти всегда повышают явку
- автоматически повышают количество наблюдателей. Активисты местных кандидатов присутствуют на участках и комиссии не сильно наглеют.
Солнечногорская ТИК в этом смысле исключение. Похоже на то, что там именно "наблюдатели" от местной власти на местных выборах накачивали результаты как на одних, так и на других выборах.