Статистическая ошибка

Sep 02, 2022 11:02

Причинность против случайности.

Среди множества интеллектуальных заблуждений, терзающих человечество, особое - пожалуй, первое - место занимает чрезмерное пристрастие к статистике и теории вероятностей. Многие, очевидно, полагают, что теорвер позволяет нам обуздать любую неопределённость. Одним из результатов является попытка приписать вероятность любому событию. Какова вероятность того, что я поступлю в МГУ? Какова вероятность того, что я завоюю сердце прекрасной дамы? Какова вероятность того, что сборная России выиграет чемпионат мира по футболу? Канонический пример такого подхода продемоснтрировал ув. mr_binks вот в этом комментарии.

Идеальны же выражением описанного является старый сексистский анекдот, и сегодня, вероятно, тешащий некоторых:

Блондинку спрашивают: "Какова вероятность того, что Вы встретите динозавра на улице?" Она отвечает: "Пятьдесят на пятьдесят". "Это почему?" - недоумевает спрашивающий. "Ну как, либо встретишь, либо - нет".

Что не так с этим анекдотом - точнее, с теми кто находит его забавным? Во-первых, в нём зашита та самая ошибка: идея о том, что вероятность можно приписать чему угодно. Т.е. как бы по сюжету блондинка должна выглядеть идиоткой, но идиотом выглядит спрашивающий. Задолго до изобретения теорвера человечество изобрело концепцию причинности. И благодаря этой концепции может получать вполне уверенные ответы на многие вопросы - например, мы можем уверенно сказать, что динозавра на улице встретить нельзя, а рассуждать об этом в терминах теории вероятностей глупо.

Во-вторых, если ответ "пятьдесят на пятьдесят" и является такой же "статистической ошибкой", то дальнейшее пояснение блондинки вполне верно - если мы согласимся с глупостью и решим, что речь идёт всё же о случайном процессе. Теория вероятности не способна предсказывать результат единичного испытания, и если у нас есть случайное событие с двумя исходами, то единственно предсказание по поводу возможного исхода оного именно "либо будет, либо нет". И ничего другого (в таких ситуациях, заметим, выбор в пользу решения с большими шансами на успех является псевдорациональным).

Разбор анекдота - самое занудное занятие на свете, но я всё же рискнул показаться ещё более занудным, поскольку тема того стоит. Все мы больны Гауссом (шутка ли - сам Бертран Рассел от этого не был защищён). Эту тему, собственно, недурно раскрывает Талеб (на всякий случай: сказанное мной выше и ниже не результат знакомства с его творчеством - наоборот, я решил прочитать "Чёрного лебедя" после того, как узнал, что автор развивает схожие с моими идеи). Между тем, мы знаем - на улице нельзя встретить не только динозавра, но и человека ростом в десять метров. Мы знаем, что никто не может запрыгнуть на Луну. И то, и другое можно описать  в рамках концепции причинности, хотя это и потребует определённого погружения в биологию и биофизику.

При этом и рост, и высота прыжка описываются гауссианой. Она, как таковая, не запрещает нам десятиметровых людей или прыжки на Луну. Мы вынуждены искусственно обрезать гауссиану, и делаем это произвольно. Кому-то хватает трёх стандартных отлконений, кто-то считает, что нужно пять. Кто-то, наверное, и четвёрочку выбирает. Это важно - произвольное усекновение гауссианы подчёркивает подчинённое положение математики по отношению к "простым рассуждениям".

Впрочем, здесь, как и в любой другой ситуации, не всё так плохо. Допустим, мы решили рассмотреть результат одной-единственной войны, в которой А победили, а Б - проиграли. Война - сложный процесс с высоким уровнем неопределённости. Желание описать процесс через вероятности велико. Тем не менее, строго математическое утверждение - "нет смысла разбирать один результат, он мог быть случайным" - едва ли найдёт много сторонников. В этом случае превосходство концепции причинности над концепцией случайности представляется очевидным.

Проблемы начинаются, когда мы пытаемся взглянуть на несколько войн. Как в примере с "великими агрессорами". Мы берём группу событий, соответствующих определённому признаку ("войны между великим деражавами за последние двести лет"), и соотносим результат ("победа" или "поражения") с конкретным фактором ("инициация войны"). Итог: нам удалось найти 7 примеров, счёт 2:5 не в пользу инициаторов.

Страдающие от "статистической болезни" не могут не увидеть в "сводных данных" статистику, и, соответственно, от соблазна подтащить тяжёлую арифметическую артиллерию. Напримр, ув. nik_pog решил выступить от имени математических: выборка "мала", итоговый счёт  математически возможен для вероятности успеха 50% (p=0,22), то есть может быть результатом "чистой случайности". Причём для пуриста это упражнение кажется чем-то заведомо быссмысленным, соответствующий расчёт ув. nik_pog выполнил соответствующий расчёт "шутки ради" (ещё раз отметим парадоксальность ситуации - "статистика" с одним испытанием такой реакции не вызывает).

Подобные расчёты привлекательны (иначе и проблемы не было бы) - настолько, что я не удержался от соблазна " посчитать в ответ". Но на деле я, скорее, согласен с тем, что расчёт является заведомо бессмысленным - не только для "маленькой" выборки, но и для других выборок из текста об агрессорах.

Почему? Потому, что у нас нет нужды рассматривать результаты войн с точки зрения теории вероятностей. У нас есть куда как более мощный инструмент, концепция причинности. С ней-то и стоит работать. Увидев счёт 2:5 не в пользу инициатора, не стоит сразу предполагать, что агрессорам не фартило. Здесь мы можем предположить следующее: другие факторы, которые мы не учитывали при составлении списка, влияют на исход войны сильнее, чем фактор начала войны (заметим, что это уже очень нетривиальный для военного искусства вывод - инициатива не так хороша, как кажется, в том числе, признаюсь, и мне).

Далее, мы можем предположить - и даже утверждать - что эти факторы сложно учитывать, именно поэтому инициаторы чаще ошибались (то самое "политики плохо понимают войну"). Одна из сложностей - оценка баланса сил. Каковая всегда неоднозначна (из-за неоднородности вооружённых сил и военного потенциала в целом), и каковую труднее всего выполнить в ситуации, когда потенциалы сравнимы. Вторая сложность - реакция третьих сил, тот самый фактор "внезапной коалиции", на который указывали в комментариях. Эту мысль можно развить, указав на то, что бить всем миром пертурбатёра - дело вполне естественное.  Можно предложить и другие объяснения, в частности - психологическое. Человеку свойственно переоценивать свои возможности (это - одно из так называемых "когнитивных искажений"), при этом у человека, склонного к агрессии, эта склонность выражена сильнее. Соответственно, если все переоценивают свои силы, то агрессоры в этом деле - чемпионы.

Будем закругляться. В короткой заметке в пыльном уголке ЖЖ я не рискну отвечать на один из фундаментальных вопросов бытия: существуют ли действительно случайные события, или прав был Эйнштейн. Ограничусь чуть менее общим: концепция причинности, по сравнению с концепцией случайности, является куда как более сильным инструментом познания и планирования действий. Поэтому к теории вероятности следует прибегать только тогда, когда причинно-следственный подход невозможен (сейчас же, увы, очень многие поступают наоборот). Не думаю, что многие заметили, но - да, текст об агрессорах я написал, ни разу не использовав слово "вероятность" (хотя пару раз был близок к этому). И это, смею заверить, не случайно.

вопросы методологии

Previous post Next post
Up