Дилемма узника. Революция внутри

Feb 18, 2013 20:14

Есть игры, в которых единственная выигрышная стратегия - не начинать игру.

Представь, насколько лучше стал бы мир, если бы на свете не существовало ни одной армии. Огромные военные бюджеты могли бы быть использованы для строительства дорог, мостов, благоустройства парков, дворов, создания качественно новых потребительских продуктов. Солдатам бы не пришлось страдать и умирать за чужие идеи или ради выгоды высокопоставленных свиней, которые сами ничуть не полезнее солдат.
Жаль, что эту игру так легко начать, а закончить - слишком опасно для простых людей и невыгодно для продажных политиков, заботящихся только о своей выгоде.

Представь, насколько лучше бы стал мир, если бы не было рекламы. Маркетинговые бюджеты составляют до 90% отпускной цены некоторых товаров. Если бы не реклама, товары стали бы в разы доступнее, творческие умы освободились бы для создания настоящего искусства или хорошей социальной рекламы, освободившиеся бюджеты позволили бы сделать товары лучше, а мы освободились бы от терабайт ненужной информации.
Жаль, что сейчас рекламы столько, что если ты не примешь правила этой нелепой игры, то тебя никто не заметит на этом пёстром мельтешащем фоне.

Представь, насколько лучше бы стал мир, если бы каждый из нас добровольно отдавал столько, сколько сам считает нужным, авторам понравившихся книг, программ, фильмов, музыки. Стали бы не нужны издательства, лэйблы и прочие посредники, которые забирают себе больше, чем оставляют творцу. Творцы бы стали богаче и получили стимул продолжать своё творчество, а мы бы перестали переплачивать за практически бесполезную работу посредников и, как следствие, тоже стали богаче.
Жаль, что издательства и лэйблы имеют внушительные бюджеты и медиаресурсы, так что, соперничать с ними может позволить себе далеко не каждый автор.

Сейчас любому здравомыслящему человеку очевидно, что каждую из этих игр идеально было бы не начинать вообще. В них всегда проигрывают все игроки. Но, факт: они начаты, и ставки в них только растут.

Все эти ситуации отлично моделируются дилеммой узника из теории игр.
[Формулировка дилеммы заключенного]Двое преступников, А и Б, попались примерно в одно и то же время на сходных преступлениях. Есть основания полагать, что они действовали по сговору, и полиция, изолировав их друг от друга, предлагает им одну и ту же сделку: если один свидетельствует против другого, а тот хранит молчание, то первый освобождается за помощь следствию, а второй получает максимальный срок лишения свободы (10 лет). Если оба молчат, их деяние проходит по более лёгкой статье, и каждый из них приговаривается к 0,5 года. Если оба свидетельствуют против друг друга, они получают минимальный срок (по 2 года). Каждый заключённый выбирает, молчать или свидетельствовать против другого. Однако ни один из них не знает точно, что сделает другой. Что произойдёт?
Рациональной стратегией для каждого узника в отдельности будет предательство. Если А предаст Б, а Б предаст А, то оба получат по 2 года тюрьмы, что не так страшно как 10. Если же Б промолчит, то А и совсем выйдет на свободу. В случае же, если А будет молчать, то он в любом случае окажется за решёткой: либо на 10 лет, если Б предаст его, либо на полгода, если Б также промолчит. Разумеется, действуя только из соображений личной выгоды, А и Б предадут друг друга и сядут на 2 года.

Но лучшего результата можно было бы достичь, если бы они оба промолчали. Тогда им пришлось бы провести в тюрьме лишь по погода.

В таком мире мы и живём: каждый день приходится выбирать: предать или промолчать. Заказать 1000 новых ракет или направить деньги на образование. Вложить миллион в рекламу или в улучшение продукта. Перевести сто рублей автору понравившейся книги или в благотворительный фонд или купить себе чашку кофе в кафе.
Мы - эгоисты, поэтому обычно принимаем правила игры и идём по самому простому и надёжному пути - предательство, ракеты, реклама и чашка кофе.

Что делать?
Если бы вся жизнь состояла из одного решения, оптимальной стратегией для всех было бы предательство. Но жизнь сложна, и она состоит из ежеминутных решений.

Рассмотрим несколько возможных стратегий:
Выгодная стратегия в многократно повторяющейся дилемме заключенного была предложена Анатолием Раппопортом и она называлась "Око за око". Суть её в том, что в первый ход мы молчим, действуя из альтруистических соображений, а начиная со второго кона повторяем предыдущий ход соперника.
Она даёт отличные результаты, но против игроков с некоторыми другими стратегиями иногда приводит к бесконечному зацикливанию предательства.

Более выгодная стратегия была разработана чуть позже. Она называется "Око за око с прощением". Теперь в случае предательства оппонента мы отвечаем ему тем же, но с небольшой вероятностью (5-10%) мы его "прощаем" и молчим в ответ на предательство. Это позволяет "случайно" выбираться из бесконечных циклов взаимного предательства, но иногда приводит к таким же случайным и обидным проигрышам.

Анализируя стратегии, набравшие лучшие результаты, Роберт Аксельрод назвал несколько условий, необходимых, чтобы стратегия получила высокий результат ("Эволюция кооперации", 1984 год):
Добрая
Важнейшее условие - стратегия должна быть «доброй», то есть не предавать, пока этого не сделает оппонент. Почти все стратегии-лидеры были добрыми. Поэтому чисто эгоистичная стратегия по чисто эгоистическим причинам не будет первой «бить» соперника.
Мстительная
Успешная стратегия не должна быть слепым оптимистом. Она должна всегда мстить. Пример немстительной стратегии - всегда сотрудничать. Это очень плохой выбор, поскольку «подлые» стратегии воспользуются этим.
Прощающая
Другое важное качество успешных стратегий - уметь прощать. Отомстив, они должны вернуться к сотрудничеству, если оппонент не продолжает предавать. Это предотвращает бесконечное мщение друг другу и максимизирует выигрыш.
Не завистливая
Последнее качество - не быть завистливым, то есть не пытаться набрать больше очков, чем оппонент.

Вот и ответ на вопрос "Что делать". Это математика, с ней не поспоришь.

алгоритмизация неалгоритмизируемого

Previous post
Up