Оригинал взят у
8cinq в
Гауссиана - фальсификация для доказательства фальсификацииПредыстория
В период пост-выборного срача, в интернете появились несколько видов "математического доказательства" фальсификации выборов. Например вот такой график, так называемой "гауссианы".
Впервые столкнувшись с гауссианой при анализе выборов, я впал в ступор. Я не математических наук доктор, а матанализ для меня давно законченный предмет из далекого университетского времени. Но я всегда считал, что с математикой и логикой у меня лады - мне часто приходится иметь дело с функциями по работе, приходится думать над логикой работы больших систем в веб проектах - тренировка есть. Но тут я почувствовал себя дураком - я читаю комментарии "математического доказательства", которые изобилуют уверенностью в своей правоте. Даже те, кто умом, на вид, не отличается - и те похоже все поняли. А я сижу и вижу только лишь гистограмму, которая сообщает нам бессмысленную статистику. При чем здесь гауссиана? Как вообще можно применять гауссиану в качестве социологического исследования?
Я постучался в скайп к своему знакомому, ядреному технарю, который уж точно должен был мне вправить мозги. Тем более никакой симпатии к власти он не испытывает. Он тоже напрягся, подумал, мы почитали тексты эсквайра и блогов - но смысл всего этого действа опять ускользнул от нас. Стало ясно, что дело мутное и нужно в это серьезно вникать, чтобы написать опровержение. На написание статьи ушло 2 дня. Задача представлялась сложной. Сложно объяснять бессмысленность.
Благодарю
4izh за помощь в составлении материала. Его комментарии в тексте будут отмечены вот таким цветом.
Что такое гауссиана и что она здесь делает?
Начнем с того, что гауссиана - это функция, которая предназначена для изучения отклонений в технических измерениях. К гистограмме выборов это не относится, ведь никакой функцией мы не пользуемся. Если и есть смысл применять к ней какой-то научный термин, то это Нормальное Распределение - такое распределение случайных данных, гистограмма которых напоминает колокол по своей форме.
Область применения гауссианы. Например, мы изобрели супер нанотехлологичный измеритель радиации. Оценить качество нашего изобретения можно при помощи несложных тестов: мы берем кусок урана с заведомо известным (точным) уровнем радиации и начинаем его мерить нашим прибором. Для точных показателей мы заинтересованы в большом количестве замеров (репрезентативной выборке). Замеры не будут постоянно давать одинаковый результат, а мы будем получать некий разброс. Выстроив гистограмму, мы должны получить нормальное распределение полученных величин - тот самый "колокол", где значение горизонтальной координаты пика является истинным значением уровня радиации, а из характера формы мы можем получить полезные статистические величины, как, например, погрешность измерения. Именно этот показатель и будет отвечать за качество нашего изобретения.
Но и с Нормальным Распределением существует проблема. При желании можно даже детский рисунок радуги сравнить с Нормальным Распределением по внешнему виду, но кроме как для создания "ореола научности" это не будет иметь смысла. Строго говоря, ни один анализ выборов в сети, ни одной партии, ни одной страны - не соответствует нормальному распределению. Или у вас ровный "колокол" или ваше распределение не попадает под этот термин.
Что там у других стран с гауссианой?
Чтобы доказать бессмысленность данного сравнения, мы взяли на себя работу по построению нормального распределения для выборов в Польше - страны, которую часто используют как пример хорошей избирательной системы. (Для пытливых:
таблица с данными, внутри файла ссылка на первоисточник).
Действительно что-то отдаленно похожее на нормальное распределение, почти так же, как у наших партий, которые получили меньше голосов, чем ЕР. Но это партия Польши с 8% голосов, она проиграла. А как дела обстоят с ведущими партиями?
Хм, не очень колокольно. Может быть победившая партия нам покажет лучше результат?
Как видно, никаким "колоколом" здесь не пахнет. По сему, вопрос с гауссианой считаем нужным закрыть. Если кто-то сует вам в нос данное "математическое доказательство", то можете смело раскручиваться на месте как юла, раскинув руки, громко хохоча.
График Голоса/Явка
Осталось разобраться еще с одним графиком, который можно встретить в сети. Это отношение Голоса/Явка. Выглядит он так:
С одной стороны этот график как бы намекает нам, что на некоторых участках явка невероятно высока, 90-100%, что намного реже встречается в других странах. Это нам может говорить о том, что на этих участках вбросили бюллетени.
Или нам это может говорить о том например, что это военные части, куда всех загоняют голосовать без исключения. Например, в Польше, которую мы берем за образец,
такое тоже бывает - явка 100%. А представьте сколько у нас в России военных частей? Сотни их. Можно ознакомится с
мнением непосредственного участника таких голосований.
Есть здесь и другой фактор - маленькие бедные области. Например Атяшевский район Мордовии, где за ЕР отдано 99% голосов. Это три десятка деревень в далеком отшибе от цивилизации. Какие вообще могут быть политические предпочтения в таких местах, как вы себе представляете? Там попросту не знают политической жизни. - Многопартийная система? - Ага, что-то слышал.
Сколько еще таких мест? Уйма - будет мало сказать. Приехали на вездеходе в деревушку, завезли полезной утвари от правящей партии и сказали - приходите обязательно, да голосуйте за нас. Людям то что? Проголосовали и забыли. В этом нет ничего хорошего, но и криминального тоже. Вот так в некоторых местах жизнь течет, среда обитания слишком бедная и жестокая, чтобы жить лучше. Тут уже скорей вопросы к демократическому устройству нашей страны, которое предполагает то, что далеко не везде возможно.
Говорят еще о том, что направляющая Голоса/Явка у ЕР отличается от других партий - она поднимается вверх. Но это говорит скорей о закономерности, чем о вмешательстве - иначе небыло бы ровной линии, а были бы скачки. Почему такая закономерность? Предыдущий абзац может быть на то подсказкой, а может быть и что-то другое.
Мы не можем говорить о какой-то единой причине повышенной явки, но даже в этом случае можно легко найти объяснение данному феномену. При высоком проценте явки среди голосовавших значительно повышается процент "случайных обывателей", людей далеких от политики и, разумеется, совершенно ничего не слыхавших о новых мейнстримовых тенденциях в интернете критиковать правительство. В рамках современной политической и информационной системы России повышенные показатели ЕР при высокой явке (если таковые наблюдаются) являются скорее нормой, чем отклонением от нее.
Так или иначе, здесь остается большое пространство для интерпретаций, с нами можно спорить, мы можем спорить в ответ - уже поэтому математическим доказательством этот график не является.
Кто это вообще придумал?
График Голоса/Явка относительно новое изобретение. Надо отметить, что, так называемый, независимый эксперт журнала Эсквайр, который придумал этот вид исследования - Сергей Шпилькин - физик. Не кандидат наук, и даже не работник своей профессии, а просто физик по образованию, работающий переводчиком - вот такой независимый исследователь социальных процессов. Уровень авторитетности мнения как бы намекает :)
Но это не самое интересное. Самое интересное с пресловутой гауссианой. Потому что впервые, в качестве исследования выборов, мы смогли ее отыскать только в
январе 2005 года на Украине, во время проведения оранжевой революции.
Резервная ссылка. Хочешь не хочешь, а проведешь параллели.
Добавлено:
Исследование Польши было обновлено. В нем участвовали все 25983 УИК страны, а не территориальные ИК, как это было сделано изначально. Это исключает критику по репрезентативности исследования. Тренд графиков остался тем же - даже график ЕР больше похож на Нормальное Распределение, чем график Польши. Обновленные данные можно увидеть в оригинальном посте автора:
http://8cinq.livejournal.com/32693.html