Дилемма заключённого: теория игр о долговременных последствиях альтруистических и эгоистических дел

Feb 28, 2014 14:35

Окружающий нас мир представляет собой нечто большее,чем то,что можно уловить пятью органами чувств без примеения аналитических способностей разума. И даже эта аналитическая способность - также ничто не скажет о мире,если она не натренирована соответствующим образом на различение(как адвайтисты говорят - "вивеку").
Вселенная может при определенных условиях рассматриваться как сложная составная взаимозависимая релятивистская система, состоящая из множества более малых иерархически организованных подсистем обмена материей, энергией, информацией, опирающиеся на соответствия в их структурных особенностях для того,чтоб этот обмен реально мог произойти и был выгодным для существования обоих - либо приводил к изменению баланса сил в пользу одной из них. Поведение каждой системы определяется, таким образом, её структурой - и поведением других. Структура системы определяет характер реакций на окружение и поведжение других подсистем в рамках более крупных.
Как именно это происходит - изучают такие науки, как кибернетика, теория систем, теория вероятности и математическая теория игр.

В математической теории игр рассматриваются разные варианты взаимодействий между участниками.
Одна из базовых задачек, объяснение которой Вассерманом я постила несколько постов назад, является "Дилемма узника".
Условия её могут варьироваться,но классическая формулировка такая:

Двое преступников, А и Б, попались примерно в одно и то же время на сходных преступлениях. Есть основания полагать, что они действовали по сговору, и полиция, изолировав их друг от друга, предлагает им одну и ту же сделку: если один свидетельствует против другого, а тот хранит молчание, то первый освобождается за помощь следствию, а второй получает максимальный срок лишения свободы (10 лет). Если оба молчат, их деяние проходит по более лёгкой статье, и каждый из них приговаривается к 0,5 года. Если оба свидетельствуют против друг друга, они получают минимальный срок (по 2 года). Каждый заключённый выбирает, молчать или свидетельствовать против другого. Однако ни один из них не знает точно, что сделает другой. Что произойдёт?

На первый взгляд, самой выгодной и надёжной стратегией для обоих узников является молчание: в этом случае каждый из них получает минимальный срок наказания и они остаются друзьями друг другу. И спустя какие-то полгода отсидки - снова свобода.

Но если составить матрицу выбора, картина складывается иначе. Ведь никто из них не может наверняка знать, правду ли скажет о них другой либо решит промолчать.
В случае, если позиция другого заключнного неопределённа(жизнь всегда в той или иной степени впрос случайности и неопределённости - но и с ней тоже можно математически работать) предательство становится самым выгодным вариантом действий.
Если подельник предал тебя, тогда тебе выгоднее свидетельствовать против него: иначе же ты получишь 10 лет. А так вы оба получите только по 2 года за дело.
Если подельник верен тебе, то и в этом случае его выггоднее предать: тогда ты получаешь свободу, а он либо получает максимальный срок(который он проведет в тюрьме и не скоро сможет тебе отомстить). Если же ты ему тоже верен, то ты свободы не получишь, а сядешь.

В этой ситуации, получается, что каждому из заключённых выгоднее предать друг друга.

Предательство становится самым выбодным тактическим выбором внутри этой лилы.

Получается, зло всегда победит добро на короткой дистанции, если цель - получить преимущество Здесь и Сейчас.

Как поётся в известной попсовой песенке 2000-ых про золотых рыбок:

"На дубах-колдунах растут алмазы
а под ними река течёт на базу
Золотые в реке живут пираньи:
Исполняют любые три желанья.
Ты попробуй поймать такую рыбку,
На неё из друзей нужна наживка -
Кинул друга -
И ты уже на дубе
Собираем алмазы, души - губим!"

Слушая эту песню ,надо чётко понимать, что человек, её написавший, скорее всего очень давно работает в шоу-бизнесе и профессионально наводит морок на коллективное сознание, получая с этого свои мелкие,но стабильные к колебаниям цен алмазы. За счёт того,что люди, лишенные по тем или иным причинам непосредственной эдорфинной подпитки от реального мира и реальной реализации своих желаний, продают свою нейроны в кредит этому шоубизнесу, задрачивая мозги об их песни и концерты, плодя иллдюзии,фантазии и только усугубляя свою онтологическо-экзистенциальную неудовлетворённость и пустоту.

Картина становится более сложной и интересной, когда мы переводим микроэволюционный уровень на макроэволюционный. Когда мы переходим на уровень уже не тактический,а стратегический, то есть долговременный.

Из Википедии:
"В книге «Эволюция кооперации» (1984) Роберт Аксельрод исследовал расширение сценария ДЗ, которое он назвал повторяющаяся дилемма заключённого (ПДЗ).

В ней участники делают выбор снова раз за разом и помнят предыдущие результаты.

Аксельрод пригласил академических коллег со всего мира, чтобы разработать компьютерные стратегии, чтобы соревноваться в чемпионате по ПДЗ. Программы, вошедшие в него, различались по алгоритмической сложности, начальной враждебности, способности к прощению и так далее.

Аксельрод открыл, что если игра повторялась долго среди множества игроков, каждый с разными стратегиями, «жадные» стратегии давали плохие результаты в долгосрочном периоде, тогда как более «альтруистические» стратегии работали лучше, с точки зрения собственного интереса.

Он использовал это, чтобы показать возможный механизм эволюции альтруистического поведения из механизмов, которые изначально чисто эгоистические, через естественный отбор.

Лучшей детерминистской стратегией оказалась «Око за око» (англ. Tit for Tat), которую разработал и выставил на чемпионат Анатолий Рапопорт. Она была простейшей из всех участвовавших программ, состояла всего из 4 строк кода на языке Бейсик. Стратегия проста: сотрудничать на первой итерации игры, после этого игрок делает то же самое, что делал оппонент на предыдущем шаге. Чуть лучше работает стратегия «Око за око с прощением». Когда оппонент предаёт, на следующем шаге игрок иногда, вне зависимости от предыдущего шага, сотрудничает с небольшой вероятностью (1-5 %). Это позволяет случайным образом выйти из цикла взаимного предательства. Она лучше всего работает, когда в игру вводится недопонимание - когда решение одного игрока сообщается другому с ошибкой.

Анализируя стратегии, набравшие лучшие результаты, Аксельрод назвал несколько условий, необходимых, чтобы стратегия получила высокий результат:

Добрая
Важнейшее условие - стратегия должна быть «доброй», то есть не предавать, пока этого не сделает оппонент. Почти все стратегии-лидеры были добрыми. Поэтому чисто эгоистичная стратегия по чисто эгоистическим причинам не будет первой «бить» соперника.
Мстительная
Успешная стратегия не должна быть слепым оптимистом. Она должна всегда мстить. Пример немстительной стратегии - всегда сотрудничать. Это очень плохой выбор, поскольку «подлые» стратегии воспользуются этим.
Прощающая
Другое важное качество успешных стратегий - уметь прощать. Отомстив, они должны вернуться к сотрудничеству, если оппонент не продолжает предавать. Это предотвращает бесконечное мщение друг другу и максимизирует выигрыш.
Независтливая
Последнее качество - не быть завистливым, то есть не пытаться набрать больше очков, чем оппонент.

Таким образом, Аксельрод пришёл к утопично звучащему выводу, что эгоистичные индивиды во имя их же эгоистического блага будут стремиться быть добрыми, прощающими и не завистливыми.
(с.Википедия)

И добавим к этому - ассертивными, то есть умеренно мстительными и умеющими обозначать свои границы.
В игре Го считается, что Просветления(в гошном понимании этого слова, т.е. 100 левела искусства отвоевывать свою территорию в этой "Игре Богов") достигает тот, чей стиль игры движется в соответствии с равновесием Дао, вместе с определенными параметрами принятия и отдачи, расширения и сжатия, опьянения и трезвости, чьи группы(подсистемы) выстраиваемые на пустой доске(Большой Системе), обладают самой хорошей связностью.

В жизни ассертивность - один из компонентов долгоиграющего успеха.
Мне по этому поводу вспоминается эпизод одного из немногих действительно хороших("играющих по альтруистическим правилам",таких, из которых можно "извлечь" конструктивные модели поведения) фильмов "Подержанные львы" - даже при всей его слащавости,сентиментальности, искусственности и наскоро присобаченном "хорошем конце",который режиссер поменял под влиянием зрительской критики.

image You can watch this video on www.livejournal.com

игра, лила, философия, религия, этика, бытие, математика, жизнь, дзен, дао, адвайта, мораль, двайта

Previous post Next post
Up