В нашей лаборатории периодически активизируется группа возмутителей спокойствия и начинает мучить остальных какими-нибудь парадоксами, отвлекая от работы. Иногда это что-то типа олимпиадных задачек, иногда несложные (на первый взгляд) задачи, очевидное решение для которых оказывается неправильным. Так на примере парадокса Монти Холла я обнаружил, что мое интуитивное восприятие понятия вероятности ошибочно. Не верил ни в какие словесные объяснения, до тех пор, пока не прочитал строгое обоснование с использованием формулы Байеса. После этого даже немного разочаровался в теории вероятностей. :))
Называется она Задачей о двух конвертах. Она кажется совсем несложной, но есть там интересная, на мой взгляд, деталь. Кратко приведу одну из большого числа различных формулировок этой задачки.
В комнате три человека: ведущий и два игрока. Ведущий выходит из комнаты и кладёт в конверт фиксированную (но неизвестную никому кроме него) сумму. Затем возвращается и передаёт этот конверт первому игроку. Затем выходит снова, подбрасывает монетку. Если выпал орёл, то он вкладывает во второй конверт сумму в два раза большую, чем положил в первый конверт. Если решка - в два раза меньшую сумму, чем положил в первый конверт. Затем возвращается в комнату и передаёт второй конверт второму игроку. Сумма в конверте составляет выигрыш игрока. Игроки заглядывают каждый в свой конверт, после чего им предлагают конвертами поменяться. Оба игрока знают о том, по каким правилам действовал ведущий, но не знают что выпало, когда ведущий подбрасывал монетку, и какую сумму он положил в конверт оппоненту. Стоит ли им поменяться конвертами?
Есть, по крайней мере, два возможных хода рассуждений.
Первый.
Я - первый игрок и у меня в конверте фиксированная сумма, которую я знаю. Например у меня в конверте k руб. Тогда у второго игрока с вероятностью 0,5 2k руб. и с вероятностью 0,5 k/2 руб. То есть ожидаемая величина суммы в конверте второго игрока (она же мат.ожидание) равна 0,5*(2k) + 0,5*(k/2) = 5*k/4. Это больше, чем у меня в конверте: 5*k/4 > k (если k не равно нулю). Значит, мне (первому игроку) выгодно меняться.
Аналогичные рассуждения можно провести и для второго игрока. Действительно, пусть я - второй игрок. У меня в конверте фиксированная сумма m руб. Тогда у первого игрока либо в 2 раза больше, либо в 2 раза меньше с одинаковыми вероятностями. Точнее, либо 2*m, либо m/2 с вероятностями по 0,5. Тогда ожидаемая величина суммы в конверте первого игрока 0,5*(2m) + 0,5*(m/2) = 5*m/4 > m. Значит, мне (второму игроку) выгодно меняться.
Итак, получается, что обоим игрокам выгодно меняться. Это странно, ведь если каждый из игроков независимо повторит не только свои рассуждения, но и рассуждения за своего оппонента и поймет что и ему выгодно меняться, то у обоих возникнет противоречие: меняться ли?
Есть ещё один способ рассуждений.
Второй.
Этот способ рассуждений могут повторить оба игрока, так как они оба знают правило, по которому действовал ведущий. Его легче представить рисунком.
Как видно из рисунка, сначала ведущий положил в первый конверт какую-то сумму С, а во втором конверте ничего не лежало: (С,0). Затем ведущий подбросил монетку и ситуация перешла в Состояние 1: (С, 2*С) с вероятностью 0,5, и в Состояние 2: (С, С/2) с вероятностью 0,5 (см. рисунок). Важно, что ни один из игроков не знает, в каком из состояний (Состояние 1 или 2) он находится, даже после того, как он заглянул в свой конверт. Игрокам предлагают поменяться конвертами. Результаты обмена для каждого из состояний выделены красным цветом, результаты при отсутствии обмена - синим. Учитывая, что вероятность пребывания в каждом из двух состояний равна 0,5, можно рассчитать ожидаемый выигрыш каждого из игроков для случая обмена и его отсутствия:
Если игроки меняются, то
ожидаемый выигрыш первого игрока равен
0,5*2*С + 0,5*С/2 = 5*С/4
ожидаемый выигрыш второго игрока равен
0,5*С + 0,5*С = С.
Если игроки НЕ меняются, то
ожидаемый выигрыш первого игрока равен
0,5*С + 0,5*С = С
ожидаемый выигрыш второго игрока равен
0,5*2*С + 0,5*С/2 = 5*С/4.
Сравнивая выигрыши каждого из игроков для разных стратегий (меняться и не меняться) получаем, что первому игроку выгодней меняться (5*С/4 > C), а второму - нет.
Видимо второй способ рассуждений дает правильный ответ. Но мне не даёт покоя вопрос, что не так в рассуждениях первого хода? На каком шаге ошибка и в чём? Ведь оба они в каком-то смысле есть взгляды с различных точек зрения, с различных точек отсчёта. Первый - завязан на явлении конкретной суммы в конверте, а второй - на сущностной схеме действий ведущего.