...на вот эту задачу 1. Есть мешок с тысячей шариков. 900 черные, 100 - белые. Вероятность вытащить белый шарик 1/10. Получается делением количество белых на общее количество шариков, при условии, что шарики будут извлекаться совершенно случайным образом. Правильно?
2. Есть мешок с тысячей шариков. Мы извлекли из него случайным образом 100 шариков, каждый раз возвращая их обратно. Среди них было 10 белых и 90 черных. Вероятность извлечь белый шарик из мешка 1/10. Получается делением количества извлеченных белых шариков на количество извлеченных. Правильно?
3. Есть мешок с тысячей шариков. Мы извлекли из него случайным образом 100 шариков, но оставляли их на столе. Среди них было 10 белых и 90 черных. Вероятность извлечь белый шарик из мешка с оставшимися 1/10. Правильно?
Нет, не правильно. А всё почему? Потому что во втором пункте тоже было неправильно. Дело в том, что 1/10 - это вовсе не вероятность извлечения белого шарика, а частота его появления. Разница этих терминов вот в чем: вероятность - величина из теории вероятности, она неким образом описывает модель явления. Частота - понятие статистическое. Она некоторым образом описывает статистику явления.
Самое главное: частота исхода не равна вероятности этого исхода. Она только лишь стремится к ней, при стремлении размера статистики к бесконечности.
Можно было бы сказать: ну ладно, пусть стремится, но мы же не искали точное значение вероятности, мы его только оценивали, а при стремлении частоты к вероятности, частота может быть хотя бы грубой ее оценкой.
Однако оценкой она может быть не всегда. Вообще, чтобы сделать переход от частоты к вероятности, от нас требуется предположение о распределении данных. Без него переход просто невозможен. В первом примере у нас такое предположение содержится в условии: мы знаем всё множество, на котором работаем, и знаем, как именно из этого множества извлекаются элементы.
Во втором примере мы всего множества уже не знаем. У нас есть сведения только о его части. То есть, в сразу совершить переход от частоты к вероятности мы не можем.
Тут следует сделать небольшое отступление на тему научных экспериментов. Предположим, некий ученый исследует процесс появления шариков из бездонного мешка. Некоторое время он только фиксирует измерения, результаты которых тождественны пункту 2. На сотом шарике он решает, что пора бы уже процесс описать. Но проблема: мешок бездонный - все шарики не изучишь. Ученому на выручку приходит весь предыдущий опыт науки, который свидетельствует о равномерности природных процессов. То есть, говорит как раз о том, что природные процессы обладают ценным качеством - стремлением частоты к вероятности (кстати, есть и другие, выведенные экспериментально закономерности для природных процессов, например, гауссово распределение ошибок). Ученый не знает, является ли природным процессом происхождение шариков в мешке. Ведь вполне возможно, что ему их подсовывает спрятавшийся в мешке коллега. Который сразу после сотого шарика начнет давать только белые. Однако ученый по каким-то причинам не может проверить содержимое мешка. Тогда он делает хитрый ход: вводит предположение о равномерном распределении шариков, основываясь на том, что лучшего предположения у него на данный момент нет. Это предположение позволяет ему считать частоту появления белых шариков близкой вероятности их появления. Следует заметить, проделанное ученым не является доказательством верности его предположений о вероятности появления белых шариков, это - только лишь лучшая из возможных на данный момент гипотез.
Во втором примере ситуация несколько иная. Мешок конечен, но содержимое его неизвестно. Однако шарики после извлечения возвращаются обратно в мешок, что делает процесс извлечения бесконечным и равномерным, сводя ситуацию к примеру с ученым. Дополнительным фактором здесь является то, что в мешке оказываются уже изученные шарики, причем количество изученных шариков постоянно растет. А соотношение между изученными шариками мы знаем. То есть, здесь мы так же вычислили частоту, но можем утверждать, что она стремится к вероятности с увеличением числа экспериментов.
В чем же проблема третьего примера? Проблема в том же: у нас нет явных сведений о распределении шариков. Более того, безвозвратно извлекая шарики, мы это распределение нарушаем. Так, в частности, когда в мешке останется один шарик, частота появления белых шариков после этого момента будет существенно отличаться от наблюдаемой ранее. 0 или 1 против ~1/10.
Вернемся теперь к задаче. Первая ошибка рассуждений запрятана в переходе от пункта 2 к пункту 3. Частота появления истинных свидетельств среди экспериментально проверенных действительно сходится к вероятности извлечения истинного свидетельства из библии (при стремлении количества проверенных свидетельств к полному множеству свидетельств библии). Но только при условии случайного извлечения свидетельства из всего текста библии. Чудеса же относятся к непроверенной на экспериментах части текста. Как показывает пример 3, экспериментально вычисленная частота исхода вовсе не стремится к вероятности этого исхода на оставшемся множестве.
Чтобы исправить это недоразумение, мы должны выдвинуть предположение о распределении данных (чего, кстати, в задаче вообще не делается - это вторая ошибка). А именно: частота истинных свидетельств в библии равномерна на любом подмножестве свидетельств библии. Только в этом случае переход от пункта 2 к пункту 3 будет корректен.
Однако то, что верно (экспериментально проверено) для природных процессов, не обязательно верно для всех остальных процессов. Опыт общения с книгами показывает совсем другое: распределение неверных утверждений в разных текстах может быть совершенно разным. Например, в тексте может быть одно неверное утверждение, может вообще не быть неверных, все утверждения могут быть неверными, все, кроме одного. В тексте может быть скопление неверных утверждений в одной главе, при полном отсутствии их в других местах. И т. п.
Таким образом, предположение о равномерном распределении данных в библии ничем не подкреплено. В теории из задачи оно хоть и не озвучивается, но подразумевается между строк. Причем, подразумевается очень тонко - его не замечают.
Кстати, о том, почему его не замечают. Дело в том, что, хоть на курсе теории вероятности и говорят о различии понятий «частота» и «вероятность», все задачи и примеры содержат в себе либо разбор постулированных моделей, либо примеры из естественнонаучной деятельности, где стремление частоты к вероятности выполняется всегда. Это приводит к тому, что студент быстро забывает о сказанном и «сливает» два понятия в одно. Те же ошибки наблюдаются в социологии: в большинстве случаев социологи работают с «хорошими» множествами, быстро забывая о том, что не всякое множество - «хорошее». Равномерность распределения присутствует не везде. Это иногда приводит к грубым методологическим ошибкам.
В «парадоксе», приведенном во второй части задачи, «обыгрывается» ошибка с подменой множеств. Из проверенного первого утверждения делается вывод о ненулевой вероятности обнаружения верного утверждения в тексте. После чего этот вывод переносится на непроверенную часть текста (для которой он уже неверен).
На самом же деле вероятность истинности произвольного свидетельства из непроверенной части текста, в отрыве от проверенной, неопределенна.
Поскольку термин «неопределенность» вызвал вопросы, а так же попытку замены его на термин «неизвестна», поясню термины.
Чему равно значение в действительных числах функции sin(x) при х = 3? Тут даже калькулятор не поможет - оно неизвестно. При этом мы можем рассчитать его с любой точностью. Это будет приближением, но не будет точным значением.
Чему равно значение в действительных числах функции 1/x при x = 0? Функция в этой точке не определена. В этом отличие от «значение функции неизвестно». Для sin(x) мы можем сделать какие-то оценки, найти диапазон, в котором лежит значение и т .п. Для 1/x в нуле никаких оценок сделать нельзя. В этом отличие.
Так вот, для множества непроверенных свидетельств текста библии, вероятность случайным образом извлечь истинное не определена, пока мы не сделаем предположение о распределении данных. Без него ни о какой вероятности просто нельзя говорить. Равно как и делать какие-то ее оценки.
А предположения о распределении данных у нас нет и быть не может.
В ходе обсуждения задачи было сделано верное замечание, что в рассуждениях сделана подмена вероятности извлечения истинной фразы и на вероятность истинности этой фразы.
Подмену можно прояснить следующим примером:
Берем пример два из данной статьи. Вводим дополнительное условие: на человека, достающего шарик, надета светонепроницаемая повязка. Он извлек шарик, что он может нам сказать?
Он может нам сказать, что шарик скорее всего черный. С вероятностью 9/10.
Тут, как мы видим, тоже сделан переход от вероятности вытаскивания черного шарика к вероятности того, что уже вытащенный шарик черный. Другими словами, если вытащенный шарик - белый, то у него нет никаких шансов быть черным. Но, поскольку человек не знает цвет вытащенного им шарика, он считает этот шарик черным - так больше вероятность оказаться правым.
Однако, одно дело - считать свидетельство истинным, за неимением точных данных, другое - знать, что оно истинное.
Это - третья ошибка.
Надо отметить, что в «прообразе» теории из задачи все три ошибки уже были. Поэтому обвинение меня в «подмене теории» - беспочвенно.