Волшебники и среднеквадратичное отклонение

Jan 17, 2012 19:02

Оригинал взят у barouh в Волшебники и среднеквадратичное отклонение

В многочисленных спорах про степень фальсифицированности декабрьских выборов постоянно звучит мнение, что мол разные районы Москвы (или другого российского города) могут сильно отличаться друг от друга по составу населения, и потому 2-3-хкратная разница в уровне поддержки Единой России - это нормально

Давайте посмотрим, насколько такие колебания действительно нормальны
Для начала стоит отобрать из результатов выборов по всем 95 тысячам участков массив относительно однородных данных. Для этого я, во-первых, исключил все сельские и смешанные районы - райцентр и отдаленное село в одном районе действительно могут очень сильно отличаться, спору нет; остались только участки, представляющие чисто городские территориальные избирательные комиссии. Во-вторых, я исключил участки менее чем с 1000 избирателей - для городов такие малочисленные участки нехарактерны, и как правило это различные особые участки - больницы, СИЗО, корабли и так далее. Или просто небольшие деревни и поселки, административно приписанные к городу. Всего таких маленьких городских участков набралось около 4150 - примерно 12% от общего количества в 34 тысячи сельских участков

После всех манипуляций остался массив из 402 городов, в каждом из которых не менее 8 участков более чем с 1000 избирателей на каждом; всего - 29699 участков. Представлены все регионы страны, кроме Чукотки.
Представленный ниже график показывает распределение 402 городов по двум параметрам: среднему проценту за Единую Россию и по среднеквадратичному отклонению голосования за Единую Россию (отклонение по участкам городам от среднего по городу). То есть сравниваем средний результат ЕР по городу и степень однородности города по поддержке ЕР. При расчете обоих показателей учитываются только "полноценные" участки более чем с 1000 избирателей на каждом.

И что же мы видим? Мы видим несколько резко отличающихся друг от друга типов "поведения" городов. На графике каждый тип показан своим цветом. Ниже - комментарии и подробности. Если кратко - есть большая группа городов (больше 1/2 от всех) со стандартным «поведением» на выборах: в этих городах поддержка Единой России низкая или средняя, а разброс результатов по отдельным участкам - относительно небольшой. И есть вторая большая группа городов, в которых разброс в уровне поддержки ЕР намного больше, а средний по городу результат «партии власти» - средний или высокий. «Поведение» этих городов на выборах и их хаотичное расположение на графике выглядят странно, и дают веские основания предполагать наличие фальсификаций на существенной части участков этих городов.

Уточнение для скептиков: я далек от того, чтобы сам факт более высокого разброса результатов ЕР по участкам в том или ином городе считать безусловным признаком фальсификаций. И даже общая тенденция роста разброса результатов вместе с увеличением среднего по городу результата ЕР еще ничего не доказывает. Главное основание для утверждений, что высокий разброс результатов ЕР по участкам является индикатором существенных фальсификаций в городе, - это характер распределения точек (городов) на приведенном ниже графике. Если бы это распределение определялось естественными социальными и географическими факторами, мы бы увидели единое «облако» точек - вероятно, более плотное в одной части, менее плотное в другой, но единое. А здесь же мы видим резкие изменения плотность точек на графике и заметные разрывы между отдельными группами. Такое возможно только если есть некий мощный «дискретный» фактор, который действует в одних городах, и вообще не действует в других городах. Альтернативные версии - что это может быть помимо фальсификаций - принимаются.




Тип 1. Равномерная, и при этом невысокая, поддержка Единой России. Большое плотное «облако» точек в нижней левой части графика. Результат ЕР в этой группе городов - от 18% до 47%, как правило - между 28% и 37%, в среднем - 33%. Среднеквадратичное отклонение (СКО) - от 1,5% до 5%.
Для примера - Чебоксары: в среднем по городу у «единоросов» 33%, СКО 3,3%. В городе 186 участков, из них 162 - более чем по 1000 избирателей. Разброс результатов Единой России - от 24% до 48%, но при этом 90% участков они укладываются в относительно небольшой интервал от 28% до 38,5%. И да, если нарисовать частотное распределение по Чебоксарам, получится "почти Гаусс"
Главное: к группе подобных городов с ожидаемо невысоким разбросом результатов Единой России относится больше половины российских городов. 212 городов - из выборки в 402 города. Среди них - и маленькие городки вроде подмосковной Рошали, кавминводского Лермонтова или Мантурово в Костромской области, и большие города, притом не только Чебоксары, но и многие более крупные города: Екатеринбург, Омск, Воронеж, Ижевск и т.д. Среди городов с небольшим разбросом голосов за ЕР - и безусловно оппозиционные Иркутск, Рыбинск, подмосковные Дубна и Юбилейный, и относительно лояльные власти Алатырь в Чувашии, Норильск, Шимановск в Амурской области. Представлена вся российская география - от Калининграда до Петропавловск-Камчатского, от Апатитов до Ейска.
Промежуточное резюме: для большинства российских городов, притом весьма существенно отличающимся друг от друга по своим характеристикам, свойственна достаточно равномерная (в пределах города) поддержка Единой России. Стандартная для России картина - это когда на подавляющем большинстве участков в городе результат ЕР отличается от среднегородского процентов на 5, не больше.

Остальные 190 городов представляют собой куда более пеструю массу.
Тип 2. Непринципиальные отклонения от стандартной модели. Есть города (всего в этой группе 43 города, на графике показаны сиреневым цветом), которые по уровню поддержки Единой России и по разбросу результатов по участкам не очень сильно отличаются от описанной выше категории городов. В одних случаях небольшой размер СКО (для голосования за ЕР) сочетается с нехарактерным для других городов с таким же уровнем СКО высоким, более 50%, средним уровнем поддержки Единой России. В качестве примеров можно назвать Арзамас, уральские спецгорода Озерск и Снежинск, ямальские Салехард, Лабытнанги и Губкин. И непонятно - то ли действительно в этих городах так сильна любовь к ЕР, то ли фальсифицировали аккуратнее и равномернее, чем в других местах. Или вот, например, нефтегазовые Когалым и Муравленков - у Единой России здесь в среднем всего 40%, но уж больно маленький разброс в результатах по отдельным участкам: среднеквадратичное отклонение всего 1,2%. Опять возникает вопрос - случайно получился такой маленький разброс, или целенаправленно вытаскивали все участки на примерно одинаковый уровень поддержки ЕР? Или вот большая группа городов, в которых у ЕР вполне стандартные 25-40% - но разброс по участкам сильнее, чем в большинстве других городов: СКО составляет не 1,5-5%, а 5-7%. В этой группе в частности Новосибирск, Красноярск, Волгоград. Больший по сравнению с другими городами различия между отдельными участками в этих и подобных городах - это следствие большей неоднородности городов? Или результат фальсификаций на небольшой части участков, которые на общий результат по городу повлияли слабо, но статистику по распределению подпортили? Здесь с каждым городом надо разбираться отдельно, хотя на общую картину произошедшего в России 4-го декабря и в ночь на 5-е декабря результаты подобного анализа особо не повлияют

Тип 3. Большой разброс в поддержке Единой России. 124 города, которые, однако, не образуют какой-то единой группы, а «распылены» по большей части графика - средний по городу результат Единой России здесь колеблется от 27% до 83%, а СКО - от 7% до 27%.
Рекордсмен по контрастности голосования - Магнитогорск, где ЕР получала или 29-48% голосов, или сразу уж не меньше 76% (и до 97% на одном из участков). И ни одного участка с результатом, близким к среднегородским 57%. Следом идут Владимир и другие города Владимирской области - здесь обычные участки (где при внимательном контроле со стороны КПРФ Единая Россия получила по 20-40%) разбавили несколькими десятками специально созданных на предприятиях участков, на которых неизвестно откуда появились тысячи избирателей, почти поголовно (по 89-99%) голосовавшие за ЕР.
Среди других городов с особенно большим разбросом в поддержке ЕР - попадавшие в СМИ с поствыборными скандалами Астрахань и Шахты. Здесь же - Москва (верхний из двух более темных и крупных треугольников) и Петербург (аналогичная метка пониже). Также подозрительно большой разброс в результатах Единой России в таких крупных городах, как Нижний Новгород, Самара, Челябинск, Казань, Уфа, Ростов, Саратов, Краснодар (но есть и города меньшего размера со столь же большим разбросом - например, Сызрань, Туапсе, Усинск).
Пример Нижнего Новгорода уже разобрали подробно ( 1, 2), сомнений в фальсификациях там не остается. А вот например подробности про Краснодар: в городе есть несколько участков, на которых ЕР получила менее 30%, и достаточно много участков с результатами менее 40%. Есть и локальный пик - в диапазон от 43% до 44% попало 11 участков. Но есть и более заметные пики, притом - вот же совпадение - они все приходятся на круглые проценты: 15 участков в интервале 55-56%, 15 участков на 60-61%, 14% участков на 65-66%. В сумме на эти три однопроцентных интервала приходится 44 из 272 краснодарских участков. Для сравнения - на 3 интервала, идущих перед ними, приходится только 16 участков, а на три последующих - 19 участков. Локальная версия «гребенки Чурова» во всей красе. Тяга краснодарских избиркомов к круглым процентам и другие фокусы привели к тому, что даже в широчайший диапазон от 33% до 67% результат Единой России попал менее чем на 90% участков.

Тип 4. Тотальная фальсификация результатов. Для городов, в которых средний официальный результат Единой России превышает 85%, вновь, как и для городов с наименьшей поддержкой ЕР, характерна равномерность результатов по отдельным участкам города - СКО не подымается выше 5%. Столь же небольшой разброс встречается и в некоторых (но не во всех) городах с несколько более низким результатом Единой России (73-84%).
Лучший пример - ингушский Малгобек. 12 участков, и на всех участках результат ЕР от 92,0% до 92,5%. О статистической невероятности совпадения результатов выборов по отдельным участкам внутри одного ТИКа на Северном Кавказе я уже писал, упоминались там и города - например, Владикавказ и Махачкала. Скопление точек в нижнем правом углу на приведенном выше графике имеет такую же природу - это фальсификация результатов на всех участках в пределах города, притом фальсификация не в форме «корректировки» исходных результатов, а в формате заполнения итогового протокола по указаниям из ТИК без подсчета самих бюллетеней.
Среди городов, попавших на графике в четвертую группу (а всего это 23 города), - все городские ТИКи Северного Кавказа, за исключением Майкопа и Баксана, плюс Стерлитамак в Башкирии и Бугульма, Заинск, Буинск, Нурлат в Татарстане, а также Уварово в Тамбовской области и Новый Уренгой на Ямале.

Для удобства разглядывания ниже даю вторую картинку - укрупненный фрагмент того же графика. Можно подробно посмотреть на зону, где кончаются типичные значения и начинаются нетипичные.



Итого получаем:
- в большинстве городов России (212 из 420 рассмотренных) характер распределения участков по уровню поддержки Единой России не дает оснований говорить о заметных фальсификациях
- средний результат ЕР по этим «стандартным» городам - 33%
- в то же время примерно в 150 городах по всей видимости на многих участках имели место фальсификации; среди этих городов - Москва, Петербург и многие другие крупные города

фальсификации, выборы-2011

Previous post Next post
Up