Проверка на вшивость по Байесу

Jul 12, 2016 16:16

Нам дали урну, полную шаров, клятвенно заверив, что каждый из них черный либо белый. Наугад мы вытягиваем один шар - он оказывается черным.

Какова вероятность того, что следующий вытянутый шар окажется черным?

Комментарии не скрываю, вернусь к вечеру.
___

Ответ - 2/3. Решение чуть позже.
___

Для начала оговорки: пусть выборка производится с возвращением, а количество шаров в урне близко к бесконечности. В целом условия таковы, что вероятность вынуть черный шар не меняется в зависимости от результатов проведенных опытов. Аналогия: вместо урны - стрелок, вместо вынутого черного шара - попадание в цель. Мастерство стрелка не меняется в процессе тренировки, он всегда стреляет так, что попадает с одинаковой вероятностью (он вообще робот со вшитым ГСЧ, например). Да, не слишком четко сформулировал, и в итоге комментаторы ушли в другие дебри.

Кто знает про теорему Байеса - молодцы, быстро поймут, куда клоню. Остальным надо объяснить. В простых задачах на нахождение вероятности определены все начальные условия, и там все четко. Но даже если начальные условия могут быть разными, можно рассчитать итоговую вероятность события, но для этого нужно определить вероятности 2-го порядка: установить набор гипотез, для каждой из них отобрать случаи, удовлетворяющие условиям задачи, и уже на основе этого делать заключения.

Пример: есть три стрелка. Один попадает в цель с вероятностью 30%, другой - с 40%, третий - с 80%. Мы видим стрелу, попавшую в цель. Какова вероятность того, что ее выпустил первый стрелок?

Пусть стрелки выпустят по n стрел каждый. В цель из них попадут 0,3n+0,4n+0,8n=1,5n (половина от выпущенных, кстати). Среди всех торчащих в мишени стрел первому стрелку принадлежит 0,3n/1,5n=20% - это и есть та самая вероятность.
___

Теперь к нашей задаче. Фишка в том, что у нас нет информации о доле черных шаров в урне (= вероятности вынуть черный шар). Мы можем дать бесконечный набор гипотез - непрерывный ряд от 0 до 100%. Представим себе единичный квадрат на координатной плоскости и отложим эти гипотезы по Ох. Каждой из них соответствует столбик нулевой ширины (интегрирование проходили? Ну вот).

Мы увидели вынутый черный шар. Это дает нам некоторую информацию. Если верна гипотеза "доля черных шаров = 43%", то 43% исходов будут заканчиваться тем, что мы увидели. Вообще, закрасим на нашем квадрате ту долю каждого столбика, которая соответствует благоприятному исходу. Сообразили, что получится? Нижняя правая половина единичного квадрата, отрезанная по диагонали. Вся эта половина - это "торчащие в мишени стрелы", множество благоприятных исходов. Центр тяжести треугольника легко находится геометрически как точка пересечения медиан, его абсцисса равна 2/3. Это и есть ответ - вероятность, полученная суперпозицией всех гипотез (столбцов) с весами (их высотами), соответствующими доле нужных нам исходов при каждой из них.

Если бы мы не наблюдали вынутый черный шар, то для каждой из гипотез нашим условиям удовлетворял бы весь столбик, и мы бы искали центр масс единичного квадрата - ясно дело, это 1/2. Если бы мы наблюдали два черных шара и построили график вероятности такого исхода, получилась бы парабола, и надо было бы искать центр масс того вогнутого уголка, который она отсекает (3/4 там получается, если проинтегрировать).

В общем, чем больше мы вынимаем черных шаров подряд, тем перекошеннее в бОльшую сторону становится множество наших гипотез о том, какова их доля (а начиналось все с симметричного случая - равномерного распределения гипотез от 0 до 1): гипотезы о малых долях становятся менее вероятными, о высоких долях - более вероятными. Соответственно, тем больше среднеожидаемая гипотеза и собственно искомая вероятность, то есть ожидаемая доля черных шаров.
___

Надо полагать, многие из вас так ни черта и не поняли, если изначально с Байесом были нелады. Мда, зря я все это затеял.

пробабли, наука

Previous post Next post
Up