Теория игр разума

Oct 27, 2014 09:00


Кадр из фильма Рона Ховарда «Игры разума» (2001)
Эта биографическая драма Рона Ховарда рассказывает о жизни Джона Форбса Нэша,
лауреата Нобелевской премии по экономике 1994 года
«За анализ равновесия в теории некооперативных игр»
Что лучше - мстить, коварно потирая руки и заливаясь злобным смехом, или воспитывать в себе благородное чувство всепрощения ко всем предающим? И можно ли выйти победителем из игр разума? uncklediusha о дилемме заключённых, спорах компьютерных программ и стратегиях человеческого поведения.
uncklediusha рассказывает:
Один из самых занимательных вопросов человеческой жизни - как жить правильно?
Этот вопрос состоит из сотни вопросов помельче.
Как поступать с другими людьми в различных ситуациях? Быть хорошим или плохим или касаткой? Как это - быть хорошим? Что такое - быть плохим? Прощать ли предавшего? Предать самому - это допустимо?

В теории игр есть широко известный парадокс - дилемма заключённых.
В изначальном, простом виде, суть её можно изложить следующим образом:
Вас с вашим обаятельным другом Игнатом/Жоржеттой (не нужно ничего подчёркивать, симпатично же вышло) берут за горло фараоны по поводу ограбления.
Вас разводят в разные комнаты и каждому/ой говорят одно и то же где детонатор!!! варювонакиллми!!!.
А именно - сдай своего подельника и тебе скостят срок, а он получит по полной.
Сдашь - тебя отпустят, он получит лет десять.
Он тебя сдаст - сам понимаешь, всё наоборот.
Будете оба молчать - отсидите полгода каждый.
Оба начнёте говорить - каждый отсидит по два года.
Наиболее рациональная стратегия для каждого - предать Игната-Жоржетту к чёртовой матери и стать свободным человеком.
При этом если оба будут ей следовать (что весьма вероятно), то и сидеть будут оба же долго и счастливо и умрут в один день, тюрьма же, тут всякое случается.
Парадокс в том, что если оба игрока будут молчать, не используя наиболее рациональный шаг в этой ситуации, они получат всего по полгода и для их общей игры - это самый выгодный расклад.

Как водится в теории игр, вся эта радость выросла в горы исследований, очень интересные эксперименты и прочую херню, в виде прикладного применения для разнообразных расчётов в биологии и немного в экономике.

Самое интересное, что произошло с этой дилеммой, на мой взгляд, это исследования политолога и математика Роберта Аксельрода.
Он устроил по ней чемпионат среди своих коллег и товарищей. Условия были следующими:
Эту игру с выбором «сотрудничать» или «предать» сделали многоразовой. Каждый участник должен был написать компьютерную программу. Каждую написанную программу схлёстывали с каждой, один на один и подсчитывали баллы каждой схватки.
И самое важное - все игроки помнили предыдущие результаты и использовали эти данные.

Победила с большим отрывом во всей этой ярмарке умов программа Онотоле Анатолия Раппопорта, состоявшая всего из четырёх (!) строк кода.
Она начинала игру с сотрудничества, а дальше просто повторяла предыдущий выбор второго игрока. Если тот предавал - она предавала его. Если тот сотрудничал - она сотрудничала на следующем ходу.
Эта стратегия получила название «Око за око».
И сильнее её (уже, понятно, в следующей игре) оказалась только она же, но с добавлением установки «прощать предательство с вероятностью в 1-5 процентов».
Добрая, мстительная, прощающая и независтливая - вот те характеристики, которыми описывают самую эффективную стратегию.
Всего четыре строки кода оставили далеко позади хитроумные нагромождения алгоритмов.

Я вспоминаю об этом каждый раз, когда вижу, как окружающие запутываются в собственных поступках и в самих себе, словно в дрова пьяные осьминоги.
Или когда люди вокруг начинают творить разнообразное невесёлое дерьмо друг с дружкой, руководствуясь чем попало и крича «Ты просто не понимаешь!».
Мне не удаётся долго на это смотреть, начинает резать глаза.
И тогда я отворачиваюсь глажу белого пушыстого кота и злобно смеюсь и вспоминаю стратегию «Око за око».

Года три назад я впервые прочёл об этом и примерил к своей личной системе принципов.
Именно этой простой стратегией я и пользуюсь, когда не знаю как поступить, каким бы странным это не показалось.
И это работает.
Может и вам пригодится.

UPDATE: Глубоко уважаемая мною kroshka_cat в комментариях сделала очень верное замечание на тему ДЗ:
«В обыденной жизни она имеет право на жизнь, да; но в ограниченных случаях - только тогда, когда ситуация описывается моделью „игра с нулевой суммой“. То есть сумма всех выигрышей и проигрышей - равна нулю (т. е. если вы выиграли, обязательно кто-то проиграл). Дилемма заключенного - это пример игры с нулевой суммой.
Однако подавляющее большинство жизненных ситуаций представляют из себя игры с НЕнулевой суммой»

Благодаря ей понял, что не уточнил ещё один важный момент. Просто вынесу сюда кусок своего ответа:
«Дело в том, что Аксельрод рассматривал неклассическую ДЗ.
А ту ДЗ, в которой введён банкомат. Банкомат переводит дилемму в разряд игр с ненулевой суммой.

И расклад Кооперации-Отказов был примерно такой (не ручаюсь за точные цифры):
КК - оба игрока получают по баллу.
КО - отказавший в сотрудничестве получает 2 балла, выбравший сотрудничать - 0 баллов. (или штрафуется на 0.05, к примеру)
ОО - оба отказавшихся получают штраф в 0.10 балла.

В таком виде, к примеру, по мнению Докинза (который и подтолкнул меня к изучению этой темы), в ДЗ играют животные и растения, где банкоматом он считает природу, а временные рамки могут содержать столетия.»

UPDATE 2: Комментарии выдались куда интересней и информативней поста, что уж греха таить. Если возникает мысль в стиле «ух ты, надо использовать эти ориентиры», имеет смысл сначала почитать комменты. Глядишь и откажетесь от этой идеи. :)

Читать в блоге автора

В комментариях читатели стали делиться своим жизненным опытом и выяснили, что в некоторых ситуациях теория рассыпается, если применять её на практике.

e_movo пересказывает историю из своей жизни:
Забавно как иногда Вселенная резонирует.
У меня недавно ситуация была - человек, которому я верила, и который, как мне казалось, был мне практически другом, сделал мне бяку.
Не потому, что падлец и нигадяй, просто, во-первых, ему было невыгодно предупреждать меня о том, что я с каждым шагом приближаюсь к пропасти, во-вторых, ему было наплевать - свалюсь я или нет.
Ибо пропасть не такая уж и глубокая, ну покалечусь, с кем не бывает, но не убьюсь же. Наверное.
Я свалилась.
Покалечилась.
Выжила.
Мы теперь общаемся только по работе - хотя он иногда забывается и ведет себя как раньше, словно мы снова почти друзья.
А я помню и думаю о том, что долги надо отдавать.
И что меня неотданный долг мучает.
Я хочу уж закрыть эту ситуацию.
И сейчас у меня появилась возможность этот долг вернуть.
Не в том объеме, не той глубины пропасть будет, и проценты брать я пока не планирую, хотя они наросли неплохие, конечно.
Я их могу взять, могу не взять, в зависимости от того, как поведет себя человек после того, как он получит возврат от меня (и если дело дойдет до процентов, будет жопа кое-кому. Мне тоже, но больше именно из-за внутренних установок).
Но.
Я к чему - я все думаю о морали в этой ситуации.
О том, что обида - это инфантильное и детское чувство, и предаваться ему негоже.
О том, что я, в общем-то, практически безнаказанно этот долг могу вернуть (ну, не считая того, что могу потерять стабильный источник дохода), и мне не страшно делать другому больно - не страшно именно в плане возмездия с его стороны.
Хотя, опять же, работу жалко.
Но.
Я думаю о том, что если я этот долг не верну, он меня задушит.
И человек, который меня подставил, не получит свой урок и не поймет, что бяку делать не надо - если не на уровне взрослого понимания, когда ты не делаешь другому плохого потому, что ты понимаешь, что это недопустимо, а хотя бы на детском - что за это прилетит по ушам.
И вот твой пост тут об «Око за око».
Прямо забавно.
Ответить

kroshka_cat даёт ценные советы предыдущему комментатору:
в этой вашей ситуации нужно подумать в первую очередь о.. себе. А как мы знаем из Нового Завета - забота о себе любимом начинается с заботы об окружающем мире. Это требуется делать не из каких-то абстрактных соображений - а потому, что иначе еще больше синяков получишь - а то и вовсе помрешь в неожиданных последствиях схватки око-за-око. Окружающий мир-то отвечает на наши действия - всегда. Обратка всегда прилетает - и чаще всего с самой неожиданной стороны - с неожиданной потому, что если об окружающем мире не думать - то разумеется, возможной ответной реакции не просчитать никак.

Вот что такое мораль по-вашему? Это ведь не абстракция какая-то - это, выражаясь современным языком - стратегия игры. Мораль выводилась исключительно на массовом опыте многих поколений людей - и фиксировалась она в религии за неимением науки, как таковой.

Ну вот до исследований по теории игр - например, на тему равновесия в играх с ненулевой суммой - а это начало-середина 20 века (!) людям же жить как то надо было, верно? Это сейчас, после нобелевской премии Джона Нэша можно пальцы растопыривать - ноуко дескать, докозало, что наиболее выигрышная в средне- и долгосрочной перспективе стратегия - вот такая то; а раньше что же? а раньше за 2 тыщи лет до математика «докозала» люди тоже были не пальцем деланные:) наблатыкались путем проб и ошибок - как физики - на базе огромной массы экспериментальных данных вывели эмпирические закономерности.

так что поступать морально надо не из высоких абстрактных соображений- а исключительно из эгоистической любви к себе.

поступать морально - это значит прежде всего крайне тщательно задуматься о последствиях своих поступков. ну удовлетворите вы специальным образом свою жажду мсти - а как на это окружающий мир отреагирует? не схлопочете ли вы еще больше всяких душащих вас эмоций в результате? да со всяких неожиданных сторон?

я не имею в виду потерю работы или прочее материальное - работа она как трамвай или мужчина - за ушедшим всегда приходит следующий.

И практический опыт человечества, выраженный в мировой литературе и религии, и чисто рациональные соображения (тут не только математика, тут и физика очень много чего накопала) показывают, что специальная мстя с приложением усилий в одну точку - очень рискованное и чаще всего совершенно неоправданное занятие. Взять на себя обязанности Бога - научить кого-то чему-то в жизни таким путем- и выйти из ситуации с прибылью хотя бы в виде душевного успокоения - невозможно. Так как у человека нет необходимых для этого ресурсов - окружающий мир слишком сложен, чтобы все просчитать точно да на перспективу.

вы извините за многа букав, просто тема интересная очень..
я вам вот тут теорию изложила, а следующим каментом кое что практическое про себя расскажу, вдруг вам поможет
Ответить

no_seagull рассуждает о лучшем мире:
«все игроки помнили предыдущие результаты и использовали эти данные» - с людьми обычно именно в этом засада. Они или не помнят (опционально помнят своим собственным образом, что предсказуемо в свете исследований памяти, которые утверждают, что память это не воспроизведение однажды записанного, но каждый раз воссоздание, с учетом сегодняшних убеждений, настроений и пр.) или хоть и помнят, но всё равно не используют (опционально - магическое мышление, вера в удачу и эпохальное - «проделывать то же самое снова и снова, но каждый раз ожидать иного результата»). Если бы люди в массе своей помнили предыдущие результаты и использовали эти данные, мы жили бы в совсем другом мире. Но, увы-)
А если учесть всякие психологические моменты - хотя бы момент разной оценки - это в теории, и, или эксперименте все участники, так же как и наблюдатели равно оценивают потенциальное наказание и прибыль и весь выбор лежит лишь в оценке риска и приоритетах. А в жизни, в условной реальной ситуации участники будут по разному оценивать не только риски и приоритеты, но и само наказание и прибыль. Что-то в духе, что один заключенный мог оценивать «сдашь - тебя отпустят» как фатальный урон репутации, намного превышающий по тяжести урон от 10 лет тюрьмы. Так что на практике самое рациональное крайне зависимо от индивидуальных предпочтений, о которых нам обычно мало что известно.
А еще, очень забавно, как жесткий выбор из парадокса трансформировался в многоразовый эксперимент - 10 лет тюрьмы за жизнь человека возможны максимум 4 раза, ну пять, хотя пятый уже будет не слишком существенным. Плюс редкость возможности оказываться с этим выбором с одним и тем же человеком, а не каждый раз с разными. Даже теоретически представить заключенного который раз за разом с одним и тем же подельником идет на ограбление, которое предсказуемо оказывается неудачным, - крайне сложно-)
Ответить

s_жизнь, психология, lifestyle, общество, s_психология, main, politics

Previous post Next post
Up