Аксельрод, подобно многим политологам, экономистам и психологам, был восхищен простой азартной игрой, получившей название «Парадокс заключенных». Как биолог я согласен с Аксельродом и Гамильтоном, что многие дикие животные и растения заняты бесконечной игрой в Парадокс заключенных, происходящей в эволюционных масштабах времени.
В своем первоначальном, человеческом, варианте эта игра состоит в следующем. Имеется «банкомет», который судит игру и выплачивает выигрыши двум игрокам. Допустим, что я играю против вас (хотя, как мы увидим, «против» - это как раз то, чего нам не следует делать). На руках у каждого игрока только по две карты с надписями Кооперируюсь и Отказываюсь. Каждый из нас выбирает одну из двух своих карт и кладет ее на стол рубашкой вверх, с тем чтобы ни один из игроков не знал, как пошел другой; собственно говоря, оба они ходят одновременно. Далее игроки напряженно ожидают, пока банкомет перевернет карты. Напряженность связана с тем, что выигрыш зависит не только от собственного хода (каждый игрок знает, какую карту положил он сам), но и от хода противника (что остается неизвестным, пока банкомет не перевернет карты).
Поскольку в игре участвуют 2x2 карты, то имеется четыре возможных исхода (из уважения к северо-американскому происхождению игры выигрыши приводятся в долларах):
Исход I. Мы оба сыграли КООПЕРИРУЮСЬ. Банкомет выплачивает каждому из нас по 300 долларов. Эта почтенная сумма называется «Награда за взаимное кооперирование».
Исход II. Мы оба сыграли ОТКАЗЫВАЮСЬ. Банкомет штрафует каждого из нас на 10 долларов. Это называется «Наказание за взаимный отказ».
Исход III. Вы сыграли КООПЕРИРУЮСЬ, а я ОТКАЗЫВАЮСЬ. Банкомет выплачивает мне 500 долларов (Плата за риск) и штрафует вас (Простака) на 100 долларов.
Исход IV. Вы сыграли ОТКАЗЫВАЮСЬ, а я КООПЕРИРУЮСЬ. Банкомет выплачивает вам за риск 500 долларов и штрафует меня (Простака) на 100 долларов.
Совершенно очевидно, что исходы III и IV представляют собой зеркальные отражения один другого: один игрок выигрывает, а другой проигрывает. При исходах I и II оба оказываются в равном положении, но исход I обоим выгоднее, чем исход II. Точная сумма выигрыша не имеет значения. Не играет также роли и то, сколько исходов оказываются положительными (выплаты), а сколько - отрицательными (штрафы). Самое главное условие для того, чтобы игра стала настоящим Парадоксом заключенных, - это относительный ранг (цена) исходов. «Табель о рангах» должен быть следующим: Плата за риск, Награда за взаимное кооперирование. Наказание за взаимный отказ. Штраф Простаку.
При чем же тут «Парадокс»? Чтобы понять это, попытайтесь представить себе мысли, проходящие через мою голову, когда я играю против вас. Я знаю, что имеются только две карты, с которых вы можете пойти: Кооперируюсь и Отказываюсь. Обсудим их по порядку. Если вы пошли Отказываюсь, то лучшее, что я могу сделать, это также сыграть Отказываюсь. Правда, мне при этом придется заплатить штраф за взаимный отказ, но если бы я пошел Кооперируюсь, то был бы оштрафован как Простак, что еще хуже. Теперь допустим, что вы пошли с карты Кооперируюсь. И снова мне лучше всего играть Отказываюсь. Если бы я сыграл Кооперируюсь, то мы оба получили бы довольно высокий куш - по 300 долларов. Если же я играю Отказываюсь, то получаю даже еще больше - 500 долларов. Отсюда следует вывод, что независимо от того, с какой карты вы пошли, моей лучшей тактикой будет Всегда отказываюсь.
Можно ли разрешить этот парадокс? Оба игрока знают, что, независимо от действий оппонента, лучшее, что они могут делать сами, это отказываться; но при этом оба знают также, что если бы только они оба кооперировались, то каждый из них оказался бы в более выгодном положении. Если бы только… если бы только… если бы только существовала какая-то возможность достигнуть соглашения, какой-то способ убедить каждого из игроков, что другому можно верить, что он не пойдет на то, чтобы эгоистично сорвать банк, если бы имелся какой-то способ проконтролировать соглашение.
В простом варианте игры «Парадокс заключенных» такой способ отсутствует. Если хотя бы один из игроков не окажется настоящим праведником, не от мира сего, игра неизбежно окончится обоюдным отказом с парадоксально жалким результатом для обоих игроков. Однако есть и другой вариант этой игры. Она называется Итерированным, или Многократным, Парадоксом заключенных. Итерированный вариант игры сложнее, и его сложность вселяет надежду.
В отличие от простого варианта игры, которая довольно предсказуема в том смысле, что Отказываюсь - единственная разумная стратегия, итеративный вариант предлагает много разных стратегий. В простом варианте возможны лишь две стратегии: Кооперируюсь и Отказываюсь. Итерация, однако, допускает множество стратегий, и какая из них лучше всех - отнюдь не очевидно. Приведем в качестве примера одну из тысяч: «играй Кооперируюсь по большей части, но в выбранных случайным образом 10% партий играй Отказываюсь». Другие стратегии могут зависеть от того, как протекала игра перед этим. Примером служит мой «Злопамятный»: у него хорошая память на лица, и хотя в основном он склонен кооперироваться, он отказывается, если другой игрок отказывался когда-либо в прошлом. Другие стратегии могут быть более снисходительными и не такими злопамятными.
Число стратегий, возможных в итеративной игре, ограничено, очевидно, лишь нашей изобретательностью. Можно ли установить, какая из них лучше всех? Эту задачу поставил перед собой Аксельрод. Он описал все 15 стратегий на одном общем языке программирования. Каждая стратегия сравнивалась по эффективности поочередно с каждой из остальных (в том числе и с собственной копией) в игре Итерированный Парадокс заключенных. Поскольку стратегий было 15, то компьютер сыграл 15 х 15, или 225, отдельных игр. После того, как каждая пара сделала по 200 ходов, все выигрыши были суммированы и был объявлен победитель.
Нас здесь не интересует, какая именно стратегия вышла победителем в игре против каждого отдельного противника. Нам важно установить, какая стратегия выиграла больше всего «денег» за все свои 15 вариантов. «Деньги» - это просто «очки», присуждаемые по следующей схеме: взаимное Кооперирование - 3 очка; Риск - 5 очков; Наказание за взаимный отказ - 1 очко (эквивалент небольшого штрафа в игре, описанной ранее); Штраф Простаку - 0 очков (эквивалент большого штрафа в игре, описанной ранее).
Не забывайте, что «игроками» в турнире были не люди, а программы, точнее - запрограммированные стратегии. Их авторы, т. е. люди, выступали в той же роли, что и гены, программирующие тела.
Интересно, что победившая стратегия была проще всех других и на первый взгляд наименее хитроумной. Она называлась «Око за око» и была представлена проф. Анатолем Рапопортом (Anatol Rapoport), известным психологом и специалистом по теории игр из Торонто. По этой стратегии первым ходом должно быть Кооперируюсь, а в дальнейшем следует просто повторять предыдущий ход другого игрока.
Око за око стратегия «добропорядочная», т. е. никогда не отказывается первой, и «незлопамятная», т. е. быстро забывает прошлые злодеяния. Здесь я хочу ввести еще один из будоражащих воображение технических терминов Аксельрода: Око за око «независтлива». Быть завистливым, по терминологии Аксельрода, означает стремление выиграть больше денег, чем другой игрок, а не стараться получить как можно большую сумму в абсолютном выражении из капиталов банкомета. Быть независтливым означает чувствовать себя вполне удовлетворенным, если другой игрок получает ровно столько же денег, сколько и вы, при условии, что вы оба выигрываете таким образом больше у банкомета. Око за око никогда по-настоящему не «выигрывает» игру. Подумайте об этом и вы поймете, что она не может набрать больше очков, чем ее «противник», в каждой отдельной игре, потому что она отказывается лишь в отместку. Она может, самое большее, сыграть вничью со своим противником. Однако каждая ничья приносит обоим игрокам по многу очков. Когда речь идет о стратегии Око за око и о других добропорядочных стратегиях, слово «противник» неуместно. Но, к сожалению, когда психологи проводят игру Итерированный Парадокс заключенных между реальными людьми, почти все игроки поддаются чувству зависти и поэтому в денежном выражении их успехи относительно невелики.