Теорема Кондорсе была сформулирована маркизом де Кондорсе еще в 1785 г: если вероятность предсказания каждого независимого индивидуума больше 50%, то вероятность того, что большинство даст верное предсказание стремится к 100% по мере увеличения числа предсказывающих индивидов.
Из этой простенькой теоремы проистекает абсолютно фундаментальное и поразительное следствие: Значительное число предсказаний независимых индивидов (взятых в совокупности) в большинстве случаев дает лучший результат, чем предсказания профессиональных экспертов.
«Толпа» может предсказать результаты событий, которые еще не произошли, лучше любых, даже самых умных и продвинутых профессиональных экспертов.
Тогда возникает резонный вопрос: если с помощью теоремы Кондорсе можно так здорово предсказывать будущие события, так что же ее уже более 200 лет не используют в этих целях? Ответ прост - не было интернета. С появлением интернета в конце прошлого века на основе теоремы Кондорсе был создан новый класс приложений - «рынки предсказаний» (Prediction Markets).
А тут есть не просто дыра, а дырища, которая скрывается в словах: если вероятность предсказания каждого независимого индивидуума больше 50%.
То есть, во-первых, надо каким-то образом гарантировать, что все участвующие в опросе всегда дают вероятность исполнения предсказаний более 50%. А во-вторых, обеспечить, чтобы все участвующие в опросе были независимы -- то есть не были знакомы с предсказаниями других субъектов, или не принимали их во внимание.
Я полагаю, что это невозможно -- особенно второе условие, причем в основном потому, что есть интернет (ну и СМИ, разумеется).
- анализ фактов, зачастую, ничего не дает для предсказаний; - аналитика больших данных создает лишь иллюзию снижения неопределенности, не редко выдавая такие корреляции, что нормальному человеку не понять.
Например, кейс пенальти - согласно статистике, наивысшие (вдвое выше среднего) показатели забиваемости показывают «самые слабые» игроки (либо зеленая молодежь, либо заканчивающие карьеру «старики»), причем бьющие, обязательно, в правый верхний угол и только с правой ноги.
Что с таким выводом делать?
Только удавиться!
В США вот уже на трех последних президентских выборах предсказания «рынка предсказаний» оказываются точнее любых опросов общественного мнения и любых прогнозов экспертов. Например, ошибка РП «MAPE of IEE» составляла всего 1,5%, против ошибки Gallup Poll в 2,4% (а до сего времени Gallup Poll славился самыми точными оценками).
В США вот уже на трех последних президентских выборах предсказания «рынка предсказаний» оказываются точнее любых опросов общественного мнения и любых прогнозов экспертов. Например, ошибка РП «MAPE of IEE» составляла всего 1,5%, против ошибки Gallup Poll в 2,4% (а до сего времени Gallup Poll славился самыми точными оценками).
Это не плюшка "рынка предсказаний", а дефект сложившейся практики (и методики) предвыборных опросов общественного мнения, который связан с двумя факторами: 1. Методика формирования выборки (денег на опрос не так много, как хочется, поэтому выборку стараются сводить к необходимому минимуму. И этот минимум довольно смешной, если посмотреть непредвзято). 2. Опросы оплачивает заказчик, а заказчиком выступает обычно одна из сторон на выборах. Дальше надо объяснять?
Мне приходилось заказывать полевые социологические исследования (слава Богу, не по выборам), так что я знаю, что говорю.
В этом смысле "рынок предсказаний" (где вопрос задается не о предпочтениях респондента, а о его прогнозе) неизбежно даст более точный результат.
Что касается экспертов и аналитики -- найдите мне 10 экспертов, которые в узкой области (да хоть бы в футболе) за последние 10 лет стабильно давали более 50% точности предсказания. НЕТ ТАКИХ!
Я Вам уже рассказывал вполне реальную историю про экспертов-аналитиков и шимпанзе?
В каком-то из университетов Айви Лиг финансовым аналитикам дали поиграться: выделили каждому виртуальную сумму, на которую они должны были сформировать пакет активов и далее управлять этим пакетом. Задача была -- получить максимальную прибыльность.
Их было 10 человек. Для контроля случайным образом сформировали на ту же сумму произвольный пакет и дали управлять им обезьяне шимпанзе (ей показывали название актива, а по ее жестам -- по заранее определенной схеме -- определяли, покупать, продавать или держать).
Через год самым прибыльным оказался тот портфель, которым управляла шимпанзе.
Дело как использовать человеческий ресурс и как раз ни какие эксперты не нужны.
Главным двигателем изменений было постепенное распространение новой парадигмы обработки данных, называемой Big Data (Большие Данные), из сферы интересов IT в сферу интересов бизнеса. Сначала Big Data породило новый класс аналитики - Big Data Analytics (Аналитику Больший Данных), позволяющую извлекать из колоссальных объемов данных скрытую в них важную информацию для принятия решений. Ключевым отличием Аналитики Больший Данных стал синтез возможностей решения 2-х супер-задач: 1) Количественной - задача «поиска иголки в стоге сена» (поскольку при поиске перелопачивался колоссальный объем данных); 2) Качественной - задача «пойди туда, не знаю куда, и принеси то, не знаю что» (поскольку неизвестно, что надо найти в стоге сена). А из необходимости решения 2-й (качественной) задачи естественным образом родился еще один - совсем новый вид бизнес-аналитики - Предсказательная (Предиктивная) Аналитика - Predictive Analytics. Новый класс Предсказательной Аналитики принципиально отличался самой постановкой вопросов при анализе Больших Данных. Раньше вопросы аналитиков ограничивались двумя следующими классами: - Что происходит? - Почему так происходит? Вопросы Предсказательной Аналитики касались уже не прошлого и настоящего, а будущего: - Что может произойти? - Какой вариант для нас лучше из тех, что могли бы произойти?
Но это еще не все. Фокусировка на будущее изменила постановку целей Предсказательной Аналитики по сравнению со всеми предыдущими типами бизнес-аналитики.
В дополнение к аналитике понимания происходящего бизнес получил новую замечательную возможность - аналитику действий для формирования желаемого будущего. Если раньше бизнес-аналитика: - позволяла лишь осуществлять статистическое прогнозирование (на основе анализа «прошлых войн») - и выработку рекомендаций (на основе анализа «верхушки айсберга» данных) И целью этих рекомендаций была выработка субъективных решений (про которые никто не узнает, было ли оно верное или нет). Новая Предсказательная Аналитика: - позволяла предсказывать будущие статистики - и подбирать управляющие параметры, максимизирующие целевую функцию в желаемом варианте будущего. Т.е. цель теперь заключалась в автоматизации процессов формирования желаемых вариантов будущего.
Интересная тема.
Теорема Кондорсе была сформулирована маркизом де Кондорсе еще в 1785 г: если вероятность предсказания каждого независимого индивидуума больше 50%, то вероятность того, что большинство даст верное предсказание стремится к 100% по мере увеличения числа предсказывающих индивидов.
Из этой простенькой теоремы проистекает абсолютно фундаментальное и поразительное следствие: Значительное число предсказаний независимых индивидов (взятых в совокупности) в большинстве случаев дает лучший результат, чем предсказания профессиональных экспертов.
«Толпа» может предсказать результаты событий, которые еще не произошли, лучше любых, даже самых умных и продвинутых профессиональных экспертов.
Тогда возникает резонный вопрос: если с помощью теоремы Кондорсе можно так здорово предсказывать будущие события, так что же ее уже более 200 лет не используют в этих целях?
Ответ прост - не было интернета.
С появлением интернета в конце прошлого века на основе теоремы Кондорсе был создан новый класс приложений - «рынки предсказаний» (Prediction Markets).
«Карта будущего» | Часть №1
Показатели «диванных экспертов».
«Карта будущего» | Часть №2
«Карта будущего» | Часть №3
«Карта будущего» | Часть №4
Reply
То есть, во-первых, надо каким-то образом гарантировать, что все участвующие в опросе всегда дают вероятность исполнения предсказаний более 50%. А во-вторых, обеспечить, чтобы все участвующие в опросе были независимы -- то есть не были знакомы с предсказаниями других субъектов, или не принимали их во внимание.
Я полагаю, что это невозможно -- особенно второе условие, причем в основном потому, что есть интернет (ну и СМИ, разумеется).
Reply
- аналитика больших данных создает лишь иллюзию снижения неопределенности, не редко выдавая такие корреляции, что нормальному человеку не понять.
Например, кейс пенальти - согласно статистике, наивысшие (вдвое выше среднего) показатели забиваемости показывают «самые слабые» игроки (либо зеленая молодежь, либо заканчивающие карьеру «старики»), причем бьющие, обязательно, в правый верхний угол и только с правой ноги.
Что с таким выводом делать?
Только удавиться!
В США вот уже на трех последних президентских выборах предсказания «рынка предсказаний» оказываются точнее любых опросов общественного мнения и любых прогнозов экспертов. Например, ошибка РП «MAPE of IEE» составляла всего 1,5%, против ошибки Gallup Poll в 2,4% (а до сего времени Gallup Poll славился самыми точными оценками).
Reply
Это не плюшка "рынка предсказаний", а дефект сложившейся практики (и методики) предвыборных опросов общественного мнения, который связан с двумя факторами:
1. Методика формирования выборки (денег на опрос не так много, как хочется, поэтому выборку стараются сводить к необходимому минимуму. И этот минимум довольно смешной, если посмотреть непредвзято).
2. Опросы оплачивает заказчик, а заказчиком выступает обычно одна из сторон на выборах. Дальше надо объяснять?
Мне приходилось заказывать полевые социологические исследования (слава Богу, не по выборам), так что я знаю, что говорю.
В этом смысле "рынок предсказаний" (где вопрос задается не о предпочтениях респондента, а о его прогнозе) неизбежно даст более точный результат.
Что касается экспертов и аналитики -- найдите мне 10 экспертов, которые в узкой области (да хоть бы в футболе) за последние 10 лет стабильно давали более 50% точности предсказания. НЕТ ТАКИХ!
Я Вам уже рассказывал вполне реальную историю про экспертов-аналитиков и шимпанзе?
В каком-то из университетов Айви Лиг финансовым аналитикам дали поиграться: выделили каждому виртуальную сумму, на которую они должны были сформировать пакет активов и далее управлять этим пакетом. Задача была -- получить максимальную прибыльность.
Их было 10 человек. Для контроля случайным образом сформировали на ту же сумму произвольный пакет и дали управлять им обезьяне шимпанзе (ей показывали название актива, а по ее жестам -- по заранее определенной схеме -- определяли, покупать, продавать или держать).
Через год самым прибыльным оказался тот портфель, которым управляла шимпанзе.
Reply
Дело как использовать человеческий ресурс и как раз ни какие эксперты не нужны.
Главным двигателем изменений было постепенное распространение новой парадигмы обработки данных, называемой Big Data (Большие Данные), из сферы интересов IT в сферу интересов бизнеса.
Сначала Big Data породило новый класс аналитики - Big Data Analytics (Аналитику Больший Данных), позволяющую извлекать из колоссальных объемов данных скрытую в них важную информацию для принятия решений.
Ключевым отличием Аналитики Больший Данных стал синтез возможностей решения 2-х супер-задач:
1) Количественной - задача «поиска иголки в стоге сена» (поскольку при поиске перелопачивался колоссальный объем данных);
2) Качественной - задача «пойди туда, не знаю куда, и принеси то, не знаю что» (поскольку неизвестно, что надо найти в стоге сена).
А из необходимости решения 2-й (качественной) задачи естественным образом родился еще один - совсем новый вид бизнес-аналитики - Предсказательная (Предиктивная) Аналитика - Predictive Analytics.
Новый класс Предсказательной Аналитики принципиально отличался самой постановкой вопросов при анализе Больших Данных. Раньше вопросы аналитиков ограничивались двумя следующими классами:
- Что происходит?
- Почему так происходит?
Вопросы Предсказательной Аналитики касались уже не прошлого и настоящего, а будущего:
- Что может произойти?
- Какой вариант для нас лучше из тех, что могли бы произойти?
Но это еще не все. Фокусировка на будущее изменила постановку целей Предсказательной Аналитики по сравнению со всеми предыдущими типами бизнес-аналитики.
В дополнение к аналитике понимания происходящего бизнес получил новую замечательную возможность - аналитику действий для формирования желаемого будущего.
Если раньше бизнес-аналитика:
- позволяла лишь осуществлять статистическое прогнозирование (на основе анализа «прошлых войн»)
- и выработку рекомендаций (на основе анализа «верхушки айсберга» данных)
И целью этих рекомендаций была выработка субъективных решений (про которые никто не узнает, было ли оно верное или нет).
Новая Предсказательная Аналитика:
- позволяла предсказывать будущие статистики
- и подбирать управляющие параметры, максимизирующие целевую функцию в желаемом варианте будущего.
Т.е. цель теперь заключалась в автоматизации процессов формирования желаемых вариантов будущего.
Reply
Leave a comment