Социология и теория вероятностей

Nov 10, 2016 07:09

Стало интересно, почему профессиональные социологи уже второй раз за год так эпически обкакиваются с предсказаниями результатов плебисцитов. Казалось бы - после Брекзита должны были проведены постмортемы, обнаружены ошибки в моделях прогнозирования и введены необходимые коррективы. Ан нет, наступили на те же грабли теперь уже с Трампом. Давайте вооружимся здравым смыслом и простой математикой чтобы попытаться понять причину неудач социолухов.

В социологических опросах главной проблемой считается нахождение репрезентативной выборки, и на это направлено большинство усилий. Но предположим, эта задача успешно решена. Опрошено 10000 человек, из них 52% за кандидата A, 48% за кандидата Б. Согласно строгой науке статистике из этого следует, что вероятность победы кандидата А практически равна 1.

Но выигрывает Б. Почему? Возможно, собака зарыта в ошибочном предположении, что вероятность самого участия в выборах конкретного избирателя никак не связана с кандидатом, которого он поддерживает, и поэтому можно смело использовать результаты опроса в качестве прогноза.

На самом деле вероятность похода на участок может быть связана с поддерживаемым кандадатом, причем двумя образами.

1. Если один из кандидатов поддерживает политическое статус-кво, а другой - за перемены, то активность избирателей второго будет выше. Назовем это пассионарным фактором. Если в предыдущем примере за А пошли голосовать 80% его избирателей, а за Б - 90%, то победит Б

А         10000 * 0.52 * 0.8 = 4160
Б         10000 * 0.48 * 0.9 = 4320

Этот пассионарный фактор очень трудно квантифицировать для использования в рассчетах. По видимому необходимо присваивать кандидатам некий коэффициент пассионарности политэкспертами, а затем использовать эмпирические данные для прогнозирования участия их избирателей в зависимости от этого коэффициента.

2.  Сама публикация результатов опросов до выборов может влиять на вероятность участия в них, в зависимости от рейтинга твоего кандидата. Если опросы показывают победу моего кандидата,  то у меня меньшая мотивация идти на участок.  То же самое, кстати, если опросы показывают полное поражение с разгромным счетом. А вот если мой кандидат отстает всего на пару процентов, то моя мотивация максимальна. Назовем это прогнозным фактором. Опять таки требуется серьезный анализ эмпирических данных, чтобы вывести зависимость между результатами опросов и мотивацией.

Сложность заключается еще и в том, как разделить влияния прогнозного и пассионарного факторов. Наверное лучший способ изучения прогнозного фактора это сконцентрироваться только на тех выборах, где коэффициент пассионарности обоих кандидатов одинаков, и значит пассионарным фактором можно пренебречь.

При этом может сложиться любопытная ситуация, когда результат выборов невозможно предсказать в принципе. Например:

Предположим, что путем исследований было обнаружено, что у отстающего на 2 процента кандидата, электорат мотивирован на 5 процентов больше. Мы провели опрос А - 51% , Б - 49%. Что нам предсказывать?

Если мы просто опубликуем эти результаты и предскажем победу А, то из-за влияния прознозного фактора победит Б.

Если, зная о влиянии прогнозного фактора, мы предскажем победу Б с небольшим отрывом, то прогнозный фактор начнет действовать в пользу А, который и победит.
Previous post Next post
Up