Продолжая анализ, начатый в предыдущем посте, попробуем оценить масштабы нарушений. Для этого удобно график распределения, приведённый там, выразить в относительных единицах:
Добавлены две кривые зависимости процента бюллетеней за ЕР и помимо ЕР к числу зарегистрированных в соответствующем процентном интервале избирателей. Видно, что кривая оппозиции после начального установления на участках со сверхнизкой явкой, плавно нарастает с 10 до 14% при росте явки, что говорит о стабильном числе сторонников и отсутствии в массовом масштабе случаев подмены бюллетеней. Кривая ЕР, начинаясь с меньших, чем у оппозиции значений, растёт с наклоном, плавно увеличивающемся (относительно начала координат) с увеличением процента явки, вплоть до 50% от числа зарегистрированных избирателей, в статистически значимой области анализа (до 60-70% показанной явки), что с очевидностью указывает на наличие вброса бюллетеней.
Прежде чем пытаться проводить дальнейший анализ, попытаемся улучшить качество распределения, исключив участки с аномальными характеристиками, у которых, предположительно, другой, неизвестный нам характер распределения и нарушений.
В дальнейшем можно проанализировать их отдельно.
Первым делом исключим участки с аномально большой, более 73% явкой. Это не нарушит сильно итогов, поскольку в таких участках зарегистрировано 0,84% избирателей.
Таким образом, исходная картинка будет иметь следующий вид:
Видя линейный характер вброса от процентов показанной явки, сделаем простое предположение о проценте вброса: вброс равен разнице показанного и некоего фиксированного процента (честного процента), умноженной на некий масштабный коэффициент в диапазоне от 0 до 1. Применение этого правила и расчёт распределения с его учётом сдвинет правую часть распределения влево, что должно улучшить форму распределения и статистические показатели приблизив, таким образом, результаты к истинным.