Верим Гауссу!

Jun 10, 2015 21:15

Everyone believes in the normal law of errors: the mathematicians, because they think it is an experimental fact; and the experimenters, because they suppose it is a theorem of mathematics. http://en.wikipedia.org/wiki/Gabriel_Lippmann

с купюрами, http://shkrobius.livejournal.com/478261.html

Ш. Сколь многие несчастия идут от преподавания статистики и теории вероятности в одном пакете! А ведь это две области с пересекающимся инструментарием, но разной идеологией. Теория вероятности - раздел математики. Статистика имеет дело с моделями реальности в условиях неопределенности. Далее работает стереотип. Математика - пример дедуктивной системы, где утверждения доказуемы и верны. Если статистика - математика, ей другая цена. На деле же все обстоит, как в известном изречении про нормальное распределение: физики думают, что оно следует из статистики, математики - из физики, статистики - из математики.

Р. Математики так не думают, извините. Существует ЦПТ, хотите с ней спорить - милости прошу.

Ш. Зачем спорить? Доказать, что конкретный случай подходит под условия этой теоремы.

Р. Вы так рассуждаете, как будто никогда не слышали о погрешностях, малых отклонениях, сходимости и т. п.

Ш. Слышал. Но какое это имеет отношение к нормальному распределению и ЦПТ? Хорошего же Вы мнения о Липпмане, если полагаете его полным валенком (о себе не заикаюсь). Допустим, рост распеределен примерно по Гауссу. И что, он определяется большим количеством одинаково распределенных независимых случайных величин, чье число стремится к бесконечности? Меня терзают сомнения. Хотелось бы каких-нибудь доказательств.

Р. Есть же такая вещь, как сходимость функции к другой функции. Она (сходимость) может быть достаточно быстрой и малочувствительной к отклонениям от сформулированных условий. В случае нормального распределения одинаковость распределения и бесконечность количества случайных величин не так уж и важны, на глаз кривая выглядит гауссовой.

Ш. И потому в природе так много лог-нормальных распределений? Это такие нормальные распределения, которые сглазили... Ладно - шутки побоку. Мы только отошли - и что я слышу? "Не так уж важно", "на глаз". Все это, несомненно, важная информация. Я начинаю догадываться, что Вам "важно", а что "неважно". Например, "глаз" у Вас так устроен, что легко принимает колокоподобное распределение за гауссово. Чем дольше мы беседуем, тем больше я о Вас узнаю. О нормальном распределении я как ничего не знал, так и не знаю.

Р. Ну, это взаимный процесс. Например, я вижу, что вы склонны делать leaps of faith, и рассуждать о том, как устроен мой глаз, не рассматривая альтернативных гипотез. Например, Вы говорите, что такое-то распределение нормально, хотя не является распределением суммы бесконечного числа случайных величин. Я отвечаю, что в случае этого распределения, значит, отклонения от строгих условий не так важны.

Ш. Я пытался наполнить смыслом бессмысленное выражение "не важно", к которому свелась беседа. Это безнадежное занятие; но что не сделаешь из любви к истине... Мне не остается ничего, кроме гадания на кофейной гуще о том, почему Х важно, а Y неважно - без малейшего намека на то, какова конечная цель.

входит математик

Х. ЦПТ - математическая теорема, утверждающая, что сумма независимых одинаково распределённых случайных величин при некоторых дополнительных предположениях (конечность моментов) после правильной нормировки сходится в пределе к нормальному распределению. Тут прорва нюансов. Во-первых, должна быть идеология, объясняющая, почему что-то суммируется. В случае, скажем, распределения особей одного и того же вида по размеру/массе нет абсолютно никаких оснований что-либо суммировать. Классический случай, когда суммирование осмысленно, - броуновское движение, когда пылинке передают импульс молекулы при случайных столкновениях. Рассеяние при стрельбе уже требует более точных моделей. Я уже не говорю о том, что даже при оправданности суммирования условия одинаковой распределенности и независимости отнюдь не всегда выполнены (скажем, флуктуациии биржевых индексов). Ну, а в самом конце цепочки, - пресловутый предел. Последовательность x^n/n! сходится к нулю при любом иксе, как известно. Желающие могут поэкспериментировать с х=10, как такая сходимость может выглядеть (а также понять, почему синус десяти плохо считать при помощи тейлоровского ряда). Скорее поразительно, насколько часто гауссиана всё же встречается в природе. Гораздо чаще, чем можно проверить выполнение условий ЦПТ. Думаю, в этом и состоит смысл "парадокса" Липпмана.

Ш. Ничего поразительного. Отклонения "не важны". Учите матчасть!

Р. ЦПТ не утверждает, что суммирование бесконечного числа одинаково распределенных фукнций - это единственный способ получения гауссианы. Но, да, некоторый парадокс виден.

Х. ЦПТ - в некотором смысле "главный" собственный вектор некоего интегрального преобразования в подходящем пространстве, связанного с суммированием случайных величин. Это примерно как фробениусов собственный вектор с собственным числом 1 для неотрицательной матрицы (скажем, стохастической). Если настоящая гауссиана (а не абы какая колокообразная кривулька) появляется в задаче, где суммирование никаким боком не должно быть причастно, - это повод задуматься, всё ли мы понимаем правильно про модель. Скажем, пресловутая "верим-гауссу-не-верим-чурову" кривая (корреляция между процентом явки и количеством голосов за одного из кандидатов) никакой гауссианой быть не обязана, а то, что написано в "Троцком варианте" - х...я безграмотная.

Ш. Мне кажется, Р. намекает на случайные блуждания, стохастику, цепи и проч. Я думаю, это ближе к истине. Какие же поросята эти демонстранты - хоть бы одно теплое слово о де Муавре на этих плакатах написали...

М. Мне всегда казалось, что нормальное распределение - это фонарь, под которым удобно искать, и все это понимают. Тем более, что оказывается, что теряют вещи часто не так уж далеко от фонаря.

Ш. Казалось бы. Но мне предлагают более интересную теорию. Что отклонения "не важны".

Х. Мне недавно рассказали историю про учительницу математики в 4 классе. Она написала на доске две простые дроби и попросила написать дробь, которая была бы между ними. Мальчик написал дробь, числитель которой был равен сумме числителей, а знаменатель - сумме знаменателей. Училка сказала, что ответ неправильный, поскольку так делать нельзя никогда!


Previous post Next post
Up