О том как жить и теории игр.

Oct 17, 2014 23:09

Один из самых занимательных вопросов человеческой жизни - как жить правильно?
Этот вопрос состоит из сотни вопросов помельче.
Как поступать с другими людьми в различных ситуациях? Быть хорошим или плохим или касаткой? Как это - быть хорошим? Что такое - быть плохим? Прощать ли предавшего? Предать самому - это допустимо?

В теории игр есть широко известный парадокс - дилемма заключённых.
В изначальном, простом виде, суть её можно изложить следующим образом:
Вас с вашим обаятельным другом Игнатом/Жоржеттой (не нужно ничего подчёркивать, симпатично же вышло) берут за горло фараоны по поводу ограбления.
Вас разводят в разные комнаты и каждому/ой говорят одно и то же где детонатор!!! варювонакиллми!!!.
А именно - сдай своего подельника и тебе скостят срок, а он получит по полной.
Сдашь - тебя отпустят, он получит лет десять.
Он тебя сдаст - сам понимаешь, всё наоборот.
Будете оба молчать - отсидите полгода каждый.
Оба начнёте говорить - каждый отсидит по два года.
Наиболее рациональная стратегия для каждого - предать Игната-Жоржетту к чёртовой матери и стать свободным человеком.
При этом если оба будут ей следовать (что весьма вероятно), то и сидеть будут оба же долго и счастливо и умрут в один день, тюрьма же, тут всякое случается.
Парадокс в том, что если оба игрока будут молчать, не используя наиболее рациональный шаг в этой ситуации, они получат всего по полгода и для их общей игры - это самый выгодный расклад.

Как водится в теории игр, вся эта радость выросла в горы исследований, очень интересные эксперименты и прочую херню, в виде прикладного применения для разнообразных расчётов в биологии и немного в экономике.

Самое интересное, что произошло с этой дилеммой, на мой взгляд, это исследования политолога и математика Роберта Аксельрода.
Он устроил по ней чемпионат среди своих коллег и товарищей. Условия были следующими:
Эту игру с выбором "сотрудничать" или "предать" сделали многоразовой. Каждый участник должен был написать компьютерную программу. Каждую написанную программу схлёстывали с каждой, один на один и подсчитывали баллы каждой схватки.
И самое важное - все игроки помнили предыдущие результаты и использовали эти данные.

Победила с большим отрывом во всей этой ярмарке умов программа Онотоле Анатолия Раппопорта, состоявшая всего из четырёх (!) строк кода.
Она начинала игру с сотрудничества, а дальше просто повторяла предыдущий выбор второго игрока. Если тот предавал - она предавала его. Если тот сотрудничал - она сотрудничала на следующем ходу.
Эта стратегия получила название "Око за око".
И сильнее её (уже, понятно, в следующей игре) оказалась только она же, но с добавлением установки "прощать предательство с вероятностью в 1-5 процентов".
Добрая, мстительная, прощающая и независтливая - вот те характеристики, которыми описывают самую эффективную стратегию.
Всего четыре строки кода оставили далеко позади хитроумные нагромождения алгоритмов.

Я вспоминаю об этом каждый раз, когда вижу, как окружающие запутываются в собственных поступках и в самих себе, словно в дрова пьяные осьминоги.
Или когда люди вокруг начинают творить разнообразное невесёлое дерьмо друг с дружкой, руководствуясь чем попало и крича "Ты просто не понимаешь!".
Мне не удаётся долго на это смотреть, начинает резать глаза.
И тогда я отворачиваюсь глажу белого пушыстого кота и злобно смеюсь и вспоминаю стратегию "Око за око".

Года три назад я впервые прочёл об этом и примерил к своей личной системе принципов.
Именно этой простой стратегией я и пользуюсь, когда не знаю как поступить, каким бы странным это не показалось.
И это работает.
Может и вам пригодится.

UPDATE: Глубоко уважаемая мною kroshka-cat в комментариях сделала очень верное замечание на тему ДЗ:
"В обыденной жизни она имеет право на жизнь, да; но в ограниченных случаях - только тогда, когда ситуация описывается моделью "игра с нулевой суммой". То есть сумма всех выигрышей и проигрышей - равна нулю (т.е. если вы выиграли, обязательно кто-то проиграл). Дилемма заключенного - это пример игры с нулевой суммой.
Однако подавляющее большинство жизненных ситуаций представляют из себя игры с НЕнулевой суммой"

Благодаря ей понял, что не уточнил ещё один важный момент. Просто вынесу сюда кусок своего ответа:
"Дело в том, что Аксельрод рассматривал неклассическую ДЗ.
А ту ДЗ, в которой введён банкомат. Банкомат переводит дилемму в разряд игр с ненулевой суммой.

И расклад Кооперации-Отказов был примерно такой (не ручаюсь за точные цифры):
КК - оба игрока получают по баллу.
КО - отказавший в сотрудничестве получает 2 балла, выбравший сотрудничать - 0 баллов. (или штрафуется на 0.05, к примеру)
ОО - оба отказавшихся получают штраф в 0.10 балла.

В таком виде, к примеру, по мнению Докинза (который и подтолкнул меня к изучению этой темы), в ДЗ играют животные и растения, где банкоматом он считает природу, а временные рамки могут содержать столетия."

UPDATE 2: Комментарии выдались куда интересней и информативней поста, что уж греха таить. Если возникает мысль в стиле "ух ты, надо использовать эти ориентиры", имеет смысл сначала почитать комменты. Глядишь и откажетесь от этой идеи. :)
Previous post Next post
Up