Результаты модельного референдума с бинарным выбором «за» и «против», испорченные бюллетени не учитываются.
На картинке сверху вы можете наблюдать весьма интересный эффект, связанный со статистическим парадоксом, известным сегодня как «хвост кометы». Он заключается в том, что чем выше явка, тем больше людей голосует «за».
Как так? Ведь выборы проводились в виртуальной стране Свободной Офисии, в качестве платформы для голосования использовался абсолютно неподкупный LibreOffice 6.4, а мнением граждан управлял Генератор Случайных Чисел, который вообще не при делах. А хвост есть. Фальсификации? Не думаю!
Давайте построим этот график вместе. Возьмите свою любимую электронную таблицу и создайте в колонке A набор случайных чисел, скажем, от 100 до 100000. Строк 400, для наглядности. Это будут избирательные участки. Затем помножьте это число на случайное число от 0.7 до 0.9 и запишите в колонку B. Это будет число избирателей, собирающихся голосовать «за». В колонке C сделайте A-B, и это будет число избирателей, собирающихся голосовать «против».
Но собираются - не значит, что голосуют. Поэтому в колонке D умножьте число из колонки B на случайное число от 0.6 до 1. Это будет явка тех, кто «за». Ну и в колонке E берём и тоже умножаем C на случайное число от 0.6 до 1. Это будет явка тех, кто «против».
Далее осталось посчитать суммарную явку в колонке F: F=D+E. Собственно явку посчитаем как отношение тех кто пришёл, т.е. колонка F, к тем, кто зарегистрирован - а это колонка A: G=F/A. И процент проголосовавших как отношение тех, кто «за», т.е. D, к общему количеству F, и тех кто против (E), к общему количеству F. H=D/F, I=E/F.
Не слишком сложно. Строим график, явка в столбце G, процент «за» в H, процент «против» в I. И получаем хвост кометы. Как?
Так. Если бы мы считали явку суммарно, на всех граждан, т.е. умножали число зарегистрированных избирателей на случайное число от 0.6 до 1, а затем делили на тех кто «за» и кто «против», то мы бы получили равномерно перемешанный график. Но в реальности так не происходит - аргументы, которые действуют на тех, кто «за», отличаются от аргументов, которые действуют на тех, кто «против». А поскольку тех, кто «за» тупо больше, именно флуктуации в явке таких избирателей и приводят к тому, что чем выше явка, тем больше тех, кто «за».
Так что давайте освободим народ Свободной Офисии от гнёта Генератора Случайных Чисел! Или нет.
P.S. Модель не учитывает, что реальное распределение избирателей сильно неоднородно, поэтому в реальности хвост куда менее распушен.