Контринтуитивная орлянка. Часть 1 : lex

lex_kravetski

Контринтуитивная орлянка. Часть 1

Feb 19, 2019 12:20

Блуждающая точка

Лет где-то так около тринадцати меня посетил вопрос.

Предположим, у нас есть точка с координатами (0, 0). Мы бросаем монетку и, если выпал орёл, сдвигаем её на единицу вправо. А если решка - влево. Чтобы процесс было проще наблюдать, то же самое мы проделываем со сдвигом вверх или вниз - при помощи ещё одного броска монетки.

Так вот, если точка будет оставлять за собой след, что мы увидим на экране или листе бумаги, после, например, тысячи таких шагов?

Сейчас вы, прежде чем читать дальше, тоже можете проверить свою интуицию или, например, глубину понимания базовых положений теории вероятности. Остановитесь вот тут, в самом начале статьи, и попробуйте представить, как будет выглядеть рисунок. Естественно, не точно - это мы не можем предсказать, поскольку не можем предсказать, как выпадет монетка, - а «принципиально». Что это будет?

Так вот, в те времена я рассуждал так: выпадение монетки равновероятно. Поэтому сколько раз она сдвинется влево, примерно столько раз она сдвинется и вправо. Вверх или вниз - так же. И такое будет продолжаться сколь угодно долго.

Поэтому наверно рисунок должен выглядеть, как некое облачко вокруг точки (0, 0). Что-то вроде почти закрашенного круга или квадрата - не совсем, конечно, ровных, но примерно их.

Благо, именно тогда я учился программировать, поэтому довольно быстро запрограммировал данный процесс - с той небольшой модификацией, что виртуальная монетка стала трёхгранной, то есть на ней могли выпасть не только 1 и -1, но и 0.

Надо сказать, что увиденное на экране меня довольно сильно поразило: там не было облачка, а было что-то такое, что вполне можно было бы принять за географическую карту какого-то континента для рисования коих я потом и модифицировал данный алгоритм.

Вот как это выглядит (кликните, если анимация не показывается).

Однако прежде чем объяснить, с чего вдруг всё происходит так, я сделаю ещё несколько дополнений.

Много что блуждает

Примерно в те же годы в моей школьной программе фигурировало броуновское движение, которое, судя по описанию, должно представлять собой тот же процесс. Однако в учебнике по физике к нему была весьма невнятная иллюстрация, а потому я даже не сразу проассоциировал одно с другим. Да и осознать эту «случайную» траекторию по рисунку было сложновато.

Вдобавок, повторюсь, даже базовые положения теории вероятности весьма контринтуитивны, поэтому даже от учителей физики мне доводилось слышать, что «маленькая частица вещества в жидкости под влиянием бьющих по ней молекул этой жидкости будет трепыхаться на месте».

Тем удивительнее было бы пронаблюдать этот процесс вживую или в компьютерной эмуляции и убедиться, что совсем даже не на месте - напротив, некоторые из брошенных в центр стакана частиц за довольно небольшое время додрейфуют до одной из стенок. Причём разные до разных, так что дело не в «течении жидкости». А некоторые частицы и правда довольно долго будут «трепыхаться» рядом с тем местом, куда упали.

Аналогичное можно было бы заметить в более привычном для людей случае, нежели наблюдение броуновского движения в школьной лаборатории.

Положим, кто-то из ваших родственников печёт на кухне плюшки. Однако вы, сидя у себя в комнате, вдруг чувствуете их запах. Это значит, что некоторые частицы ароматических веществ, вместо того, чтобы трепыхаться внутри духовки, сумели вылететь из неё, потом вылететь из кухни, потом завернуть в коридор и долететь до вашей комнаты, потом завернуть в комнату и потом как-то дорулить до ваших обонятельных рецепторов. Причём так произошло бы даже без дующих в квартире сквозняков.

И частицы ведь наверняка не имели цели - долететь до ваших рецепторов. И не знали, как до них долететь. Но долетели. В этом вот случайном процессе соударений с молекулами воздуха, с кристаллическими решётками стен, потолка и пола, и так далее.

Наконец, казалось бы, ещё более очевидный, но всё равно не очевидный момент - та самая орлянка, которой я в данном случае сдвигал точку. Сколько вы выиграете, проведя сотню игр? Выпадение орла и решки равновероятно, но какой будет сумма? Нулевой? Но всегда ли нулевой?

А если нет, то насколько далёкой от нуля?

Снова проверьте себя: насколько вам очевиден результат?

Почему же всё так?

Понять, почему точка, куда-то улетает - вместо того, чтобы рисовать облачко вокруг своего старта - можно при помощи следующего чисто логического рассуждения.

Мы стартовали с точки (0, 0) и предполагаем, что дальше вокруг этой точки будет рисоваться облачко.

Однако на первом же шаге точка сместилась, например, в (1, 1). Почему бы именно вот этой точке не стать стартовой? Почему бы облачку не рисоваться вокруг неё? Какая особая магия сие запрещает?

Потом за сколько-то шагов рисования предположительного облачка мы попали, например, в (10, 10). А этой точке что мешает быть стартовой? Почему бы вокруг неё не нарисоваться облачку? Почему бы точке, ровно так же, как она улетела из (0, 0), не улететь и от (10, 10) на 10 вправо и на 10 вверх?

Иными словами, мы довольно быстро пришли к противоречию. Если бы предположение об облачке было верно, то оно должно было бы рисоваться вокруг любой из точек маршрута. И, таким образом, должно было нарисоваться много облачков. Что противоречит предположению об одном облачке.

Дело в том, что интуитивно все эти тезисы о «равной вероятности» и «нулевой сумме при стремлении к бесконечности» подталкивают нас думать, будто бы тут речь идёт о некой «вселенской гармонии». Будто бы вселенная «блюдёт баланс и справедливость», а потому склоняет любую полагаемую нами случайной систему к равновесию вокруг той точки, с которой мы начали наблюдения.

Если проще, то нам интуитивно кажется, что, если монетка уже выпала десять раз решкой, то теперь-то наверняка должен выпасть орёл: ведь, поскольку выпадение каждой из сторон вроде как равновероятно, то после десяти решек в монетке уже накопилось много «орловости».

Но нет, монетка ничего не помнит о предыдущих состояниях. Сколько бы раз ни выпала решка, вероятность следующего её выпадения - всё та же ½, как и у орла.

И, как следствие, сколь бы сильно ни отличалась от нуля уже выигранная или проигранная нами сумма, сумма выигрыша за все последующие броски всё равно стремится к нулю, то есть вы как бы «в среднем обязаны» остаться при уже свершившемся выигрыше.

Если вы при ставке в доллар уже выиграли десять долларов за сто игр в орлянку, то это никак не означает, что «вселенная» обяжет вас проиграть эти десять долларов за сколько-то следующих игр. О нет, ожидаемая сумма всех последующих игр всё равно - ноль.

Как же много парадоксов

Кажется, что в предыдущем разделе слишком много парадоксов.

Как можно одновременно считать, что исходы равновероятны, но вы всё равно можете выиграть не чуть-чуть, а довольно много?

Как можно одновременно утверждать, что ожидаемый выигрыш - нулевой, но вы всё равно скорее всего сохраните выигранное на, скажем, первых ста играх из тысячи во время последующих девятисот игр?

Ну, во-первых, у нас имеется экспериментально подтверждение - вы же сами видите, что точка вовсе не крутится вокруг старта, а куда-то уезжает, поэтому выиграть или проиграть правда можно.

А во-вторых, надо бы разобраться, про что мы говорим вот это «скорее всего сохраните».

«Скорее всего» тут означает, что если мы не просто проведём один раз тысячу партий орлянки и посмотрим на выигрыш, а повторим тысячепартийный матч, например, десять тысяч раз, то больше всего исходов таковых тысячепартийных матчей будут показывать нам нулевой суммарный выигрыш у каждого игрока.

Именно поэтому мы говорим о «наиболее вероятной сумме» - такая сумма правда будет встречаться чаще всего.

Однако «чаще всего», в свою очередь означает, «чаще суммы, равной любому другому числу». Чаще суммы, равной любой другому числу, но совершенно не обязательно чаще всех сумм, отличных от нуля.

Например, вот в этой компьютерной имитации такового процесса у меня получилось, что нулевая сумма тысячепартийного матча имела место примерно в 270 испытаниях из 10 000 (здесь по горизонтальной оси отложен суммарный выигрыш, а по вертикальной - сколько раз он встретился).

И да, здесь она правда встретилась чаще, чем любая другая. Но явно не чаще, чем все другие вместе взятые: ведь 270 явно меньше, чем 9730.

Иными словами, наиболее вероятный выигрыш на серии партий в орлянку действительно ноль, но, тем не менее, более вероятно, что результат будет не нулевым, чем нулевым.

Более того, среди ненулевых результатов, примерно с равной частотой будут встречаться и положительные, и отрицательные суммы. То есть положительных сумм здесь примерно 4865.

Внезапно, гораздо более вероятно (в 18 раз!), что вы выиграете сколько-то денег, чем то, что вы останетесь при своих.

Правда, столь же вероятно, что вы сколько-то денег проиграете - вот в этом состоит ещё один глубокий смысл «математически ожидаемого выигрыша».

Теория вероятности против парадоксов

Если всё это записать на математическом языке, то получится вот что.

Есть у нас серия исходов, соответствующих броску монетки: 1 - орёл, -1 - решка.

Например,

Мы можем вычислить среднее по исходам.

Однако нас интересует, а что было бы, если бы мы продолжали проводить испытания.

В этом случае мы могли бы сказать, что ввиду равновероятности выпадения орла и решки, исходов было бы примерно поровну. Но ведь вполне возможно какое-то смещение. Обозначим разницу в количестве исходов в пользу, например, орлов, как k. Это означает, что единиц в числителе ровно вот настолько больше, чем минус единиц, и таким образом наше ожидание средней величины исхода будет

Каждый новый бросок совершенно точно увеличит n в знаменателе на единицу, но не каждый бросок при этом увеличит разность между орлами и решками, находящуюся в числителе, - часть из них, напротив, её уменьшит.

Таким образом, мы можем заключить, что чем больше мы сделали бросков, тем в среднем меньше среднее по исходам отличается от нуля. То есть при стремлении к бесконечности количества бросков среднее от исходов стремится к нулю.

Именно это и означают слова «математическое ожидание исхода - ноль».

Но в процессе случайных блужданий мы вычисляем совсем даже не средний исход, а сумму исходов. То есть, у нас в данном случае отсутствует тот самый знаменатель, который гарантировал нам стремление к нулю всей дроби.

И это означает, что в данном процессе уже нет закономерного стремления результата к нулю при увеличении количества бросков. Да, разность в количестве исходов действительно может в какой-то момент оказаться нулевой, но дальше она снова может начать увеличиваться в ту или иную сторону от нуля.

Хотя исходы равновероятны, раз на раз не приходится, и мы, в зависимости от везения, можем пронаблюдать сколь угодно длинный «перекос» в количестве орлов и решек на длинной серии бросков. Что как раз и показывает нам экспериментальный график распределения сумм по тысяче бросков.

Мы провели сделали тысячу бросков, просуммировали их результаты, и так десять тысяч раз. Наиболее часто встречающаяся сумма по испытаниям - ноль, однако большинство испытаний в сумме давали совсем даже не ноль.

Если мы вычислим среднюю сумму по всем тысячебросковым играм, то она тоже будет примерно равна нулю. Причём, чем больше игр мы провели, тем ближе к нулю будет средний выигрыш.

Иными словами, математическое ожидание исхода - ноль, математическое ожидание суммы исходов - тоже ноль, однако каждая конкретная сумма исходов лишь в относительно редких случаях будет равна нулю.

Если это всё ещё кажется парадоксальным, подумайте вот о чём: на монетке выпадает только орёл или решка, которым мы приписали значения «1» и «-1». Матожидание исхода равно нулю, хотя «0» на монетке выпасть не может в принципе.

Но и это ещё не финал. График распределения исходов имеет форму «колокола». Центр этого колокола примерно совпадает с математическим ожиданием, однако насколько этот колокол «широк»?

Для характеристики ширины такого рода распределений вводится величина, называемая «среднеквадратическим отклонением» и обычно обозначается как «σ».

Среднеквадратическое отклонение примерно соответствует половине ширины этого «колокола» на половине его высоты. При большом количестве испытаний внутрь диапазона от -σ до σ вокруг μ (среднего арифметического) попадёт примерно 2/3 исходов.

Если подсчитать среднеквадратическое отклонение для события «бросок монетки», то мы способом, аналогичным вышеприведённому, обнаружим, что с ростом количества бросков (n) среднеквадратическое отклонение стремится к единице.

То есть

Второе слагаемое под корнем по ранее изложенным причинам стремится к нулю при стремлении количества бросков к бесконечности, то есть само среднеквадратическое отклонение результата броска монетки в это время стремится к единице.

Однако, в отличие от среднеквадратического отклонения результата броска монетки, среднеквадратическое отклонение суммы результатов бросков в одной игре, наоборот, возрастает с ростом количества бросков за время каждой игры.

Пусть всего мы провели m игр по n бросков в каждой. «k» с индексом - это разность количества выпавших орлов и решек в каждой игре, а следовательно - сумма бросков в этой игре.

Средняя сумма по всем играм, как мы знаем, стремится к нулю с ростом количества игр, поэтому мы вполне можем считать её нулевой при вычислении среднеквадратического отклонения, полагая количество игр сколь угодно большим.

Однако если мы будем рассматривать одно и то же количество игр, но менять количество бросков монетки в игре, то обнаружим, что в знаменателе здесь стоит константа (то самое постоянное количество игр), а числитель при этом содержит сумму положительных чисел (поскольку квадрат любого числа положителен). Но чем больше бросков в игре, тем более отличной от нуля может оказаться их сумма в каждой конкретной игре. То есть с ростом количества бросков в игре числитель в среднем растёт. Причём растёт неограниченно.

Это можно представить себе следующим образом. Пусть в игре всего десять бросков. Мы провели сто игр, однако сумма десяти бросков не может быть больше десяти и меньше минус десяти. Поэтому результаты всех ста игр окажутся в диапазоне от минус десяти до десяти.

Теперь мы стали проводить игры по двадцать бросков. Понятно, что в некоторых из них результат может оказаться больше десяти или меньше минус десяти. Однако мы провели ровно те же сто игр, что и в прошлый раз, и, если некоторое количество игр по своим результатам оказалось вне прежнего диапазона, то внутрь этого диапазона попало уже меньшее количество игр, чем тогда.

И так будет происходить при каждом увеличении количества бросков в каждой из игр: числитель будет в среднем расти.

А значит - раз знаменатель неизменен, а числитель неограниченно растёт - то неограниченно растёт и сама дробь - то есть стандартное отклонение, характеризующее собой ширину «колокола» распределения выигранных или проигранных в каждой игре сумм.

Иными словами, стандартное отклонение суммы бросков неограниченно растёт по мере роста количества этих бросков, несмотря даже на то, что стандартное отклонение самого броска в это время стремится к единице.

Мы тут наблюдаем два разных математических ожидания - броска и суммы бросков, и два разных соответствующих среднеквадратических отклонения.

Матожидание и броска, и суммы бросков стремится к нулю с ростом количества бросков в игре, однако среднестатистическое отклонение броска стремится при этом к единице, а суммы бросков (то есть выигранного в игре) - к бесконечности.

Что как раз и приводит к тому, что чем больше бросков, тем чаще мы будем наблюдать ненулевую сумму в каждой конкретной игре.

Ввиду же того, что это зачастую называется одними и теми же словами, в рассуждения вносится много путаницы. Плюс к тому, математическая сторона происходящего скорее всего не совпадает с тем, что подсказывает человеку интуиция. Что и приводит к ошибочным суждениям и даже к ощущению наличия множества парадоксов в этом процессе.

Однако правильное понимание теории вероятности устраняет эти «парадоксы».

И, что немаловажно, позволяет сделать интересные выводы.

Например, вы могли бы открыть…

Курсы по игре в орлянку

Да, они будут мошенничеством. Однако давайте взглянем, почему такое мошенничество срабатывает.

Предположим, вы правда открыли такие курсы. К вам приходит десять тысяч человек и платят вам по одному доллару каждый. Вы им в обмен обещаете открыть путь к обогащению, а на самом деле просто вешаете им на уши лапшу о вере в себя, космических энергиях, ментальном единении с монеткой, глубоком изучении рынка монет и прочем подобном.

После курсов большинство, наверно, попробует обогатиться и проведёт сколько-то там игр. Пусть по тысяче, как было в примере из предыдущего раздела.

Как мы уже знаем, при своих останутся лишь порядка 270 из них. Их будут выгодно оттенять 4865 выигравших - весьма неплохой результат, ведь далеко не каждые курсы приводят к успеху каждого второго учащегося. Причём из них порядка 4600 даже отобьют свой доллар на обучение.

Именно на них вы сошлётесь в беседе с 270 оставшимися при своих и с 4865 проигравшими. Тем более, что далеко не все из них придут к вам качать права.

Те же, кто придёт, увидят истории успеха чуть менее, чем половины курса, которых вы назовёте «усердными учениками». На этом месте многие устыдятся и откажутся от претензий.

Упорствующим же вы предложите поиграть ещё. И, внезапно, снова чуть меньше половины из них выиграет. Некоторые даже сумеют отыграть проигранное в прошлый раз. Однако даже для многих из тех, кто не отыграет, довольно убедительным покажется сам факт выигрыша - а ну как они правда в прошлый раз просто неправильно использовали ваши рекомендации?

Ну и, наконец, горстке особо упёртых вы вернёте их доллар за обучение.

Да чего там, вы могли бы вернуть этот доллар вообще всем, кто проигрался - всё равно бы у вас на руках осталось порядка 5000 долларов.

Полученных за просто так. За абсолютно бессмысленные рекомендации.

Обратите, кстати, внимание: выигравших более 100 долларов будут считанные единицы, хотя каждый из них будет уверен, что он не зря отдал вам свой доллар за обучение - эвон как оно отлично, в сто раз, окупилось. Остальные покажут более скромные результаты. А чуть меньше половины вообще проиграют.

И над всеми ними будет гордо возвышаться один человек: тот самый, который в орлянку не играл вообще, но получил - в зависимости от принципов возврата - от 5000 до 10 000 долларов за обучение всех этих людей.

Мы могли бы рассмотреть и более сложные варианты. Например, курсы по обучению торговле на бирже. Но, пожалуй, оставим это в качестве почвы для самостоятельных размышлений.

Попарная орлянка

Давайте теперь немного модифицируем процесс игры. Пусть в этот раз у нас будет 10 000 человек, у каждого из которых есть 10 000 долларов. Они разбиваются случайным образом на пары, и каждая пара случайным образом выбирает ставку в данной партии - от нуля до 100 долларов. Потом они кидают монетку и, в зависимости от выпавшего, один из них платит другому эту ставку.

Потом они снова разбиваются случайным образом на пары и повторяют процесс. И так десять тысяч раз.

То есть, в результате, мы получаем десять тысяч попарных игр случайных партнёров на случайную (хотя и ограниченную) ставку.

Если бы вы не были подготовлены предыдущим текстом, то наверно сочли бы, что после такого процесса все останутся примерно при своих. Хотя… Может быть, кто-то до сих пор думает, что так оно и будет?

Но, разумеется, нет, будет совсем не так. Как и в прошлый раз оставшихся при своих скорее всего будет больше, чем оставшихся при какой-то другой конкретной сумме, но подавляющее большинство игроков останется совсем даже не при своих.

В данном случае, правда, я уже приведу результаты в виде гистограммы, где каждый столбик обозначает собой количество обладателей суммы из определённого диапазона (ширина каждого столбика в данном случае охватывает диапазон в 2000 долларов).

Как мы видим на гистограмме, некоторое количество людей вообще ушло в минуса́ - видимо, они остались должны другим игрокам кучу денег и теперь будут отдавать им долги с процентами. С другой стороны, есть некоторое количество игроков, состояние которых перевалило за 30 000 долларов - при начальных-то 10 000.

И, что особенно интересно, тут мы точно знаем, что вся эта игра - результат чистейшей случайности. Личные навыки игроков совершенно точно никак не влияли на исход. И, тем не менее, исход являет нам некоторое количество счастливчиков.

Но постойте, а вдруг…

Конкуренция вознаграждает умных и талантливых

Да-да, если переформулировать рассмотренный ранее процесс, то можно сделать совсем другие выводы.

Есть у нас общество из, положим, 10 000 человек. Они что-то производят и вступают между собой в совершенно добровольные сделки по обмену. Однако некоторые более талантливые, умные, трудолюбивые и так далее, да и условия всё время меняются (кто-то лучше под них подстраивается, кто-то - хуже), поэтому каждая из сделок может оказаться чуть-чуть в пользу одного из её участников.

Но справедливая система ведь не позволяет жульничать, а потому все случайные флуктуации должны нивелироваться. Если двое «экономических агентов» одинаково умны, талантливы и т.п., если они производят одинаково полезное другим, то все эти «иногда слегка выиграл - иногда слегка проиграл» в сумме должны дать им одинаковый выигрыш или проигрыш.

И если уж кто-то вышел в топ, то только потому, что он особо умён и особо полезен обществу. А обанкротившиеся и влезшие в долги - просто раздолбаи и лентяи.

В доказательство того, что в данной системе всё так и есть, можно даже привести в пример гистограмму распределения денежных состояний из предыдущего раздела.

Правда, придётся слегка умолчать о том, что она была получена в результате совершенно случайного процесса. В котором совершенно точно не было ни умных, ни талантливых, ни даже какого-либо полезного обществу продукта, кроме развлекательного эффекта от самой игры в орлянку.

Однако всё равно ведь гистограмма отлично ложится в эту красивую теорию: есть середнячки, которых большинство, есть особо талантливые - их мало, и именно они получили своё вознаграждение - разумеется, строго за свой талант, и есть чуть большее, чем талантливых, количество криворуких раздолбаев, которые вообще остались без ничего (да, всех банкротов мы сейчас просто сунули в одну кучу).

Немного смущает только то, что для аналогичного распределения достаточно просто самой чисто статистической закономерности - возникающей из-за совершенно случайных флуктуаций при каждой сделке двух агентов, никак не зависящих от их личных качеств. Из-за этой закономерности на гистограммах всё равно появится то, что потом можно трактовать, как «вознаграждение за талант» или «штраф за лень». То есть, вообще говоря, для реальных заключений об уме, трудолюбии, глупости и лени, а так же о том, что данная система «вознаграждает» или «штрафует» именно за них, полученную статистику следовало бы для начала очистить от эффекта, вызываемого самим чисто случайным характером процесса.

Но, благо, есть и второй вариант, сильно экономящий силы и устраняющий неудобные вопросы: как уже отмечалось выше, про чисто статистический эффект можно просто как бы забыть сказать. Как бы чуть-чуть проигнорировать его наличие. Ну, чтобы он не портил столь красивую и приятную теорию о справедливости описанной в модели системы.

Но ведь гистограммы не такие!

Возможно, кто-то из особо внимательных читателей всё-таки не стал верить автору на слово (что автор всецело одобряет) и пошёл посмотреть на гистограммы распределения состояний и доходов во всевозможных справедливых обществах.

И в результате обнаружил, что на этих гистограммах по верхушке «колокола» как будто бы кто-то стукнул справа, от чего она смялась влево. То есть распределение вроде бы не совсем такое, как тут, что совершенно закономерно намекает нам на то, что рассмотренный тут процесс не совсем точно описывается изложенной тут моделью.

Явно влияет что-то ещё. Но что? Быть может, те самые ум и глупость, лень и трудолюбие?

Есть у меня ответ и на этот вопрос. Но о нём поговорим чуть позже.

Часть 2

doc-файл
Публикация в блоге автора
Публикация на сайте «XX2 Век»

контрманипуляция сознанием, статистика, экономика, наука, контринтуитивная орлянка, xx2 век