Задача с интернет-олимпиады (послесловие)

May 06, 2011 00:23

по теории вероятностей для школьников



Как связан рост мальчиков и рост девочек? Однажды учительница математики решила показать своим ученикам, что рост мальчиков и рост девочек - независимые случайные величины. Для этого учительница провела исследование. В каждом классе она выбрала случайным образом 10 мальчиков и 10 девочек, случайно разбила их на пары мальчик-девочка и записала рост мальчика и девочки в каждой паре. Получились пары . Когда учительница отметила все результаты на диаграмме рассеивания (см. рис.) она к своему ужасу обнаружила, что точки сгруппированы возле наклонной прямой (см. рис).

Значит, между ростом мальчиков и ростом девочек есть очевидная связь! Как же так?



я просил прокомментировать эту задачу, руководствуясь здравым смыслом и математической статистикой. Как и ожидалось, большинство комментаторов поняли (применив здравый смысл), что имели в виду составители. Но меня удивило, что лишь совсем немногие обратили внимание, что с точки зрения математической статистики эта задача



представляет собой пародию. Обычная схема действий в статистике такова: есть некоторая вероятностная гипотеза, и она сравнивается с экспериментальными данными. Здесь как бы делается то же самое, и гипотеза состоит в "независимости случайных величин - роста мальчиков и роста девочек". Но гипотеза эта лишена всякого смысла.

Можно было бы говорить, скажем, о зависимости (или независимости) веса и роста школьников. Независимость означала бы - с точки зрения практической - что если выбрать какой-то интервал I для веса и J для роста, то доля школьников с весом в I среди школьников с ростом в J примерно такая же, как среди всех школьников (если эти интервалы не слишком малы).

Если взять какое-то множество супружеских пар, то можно говорить о зависимости (или независимости) роста мужа и жены (аналогично).

Формально говоря, мы должны иметь некоторый набор объектов (школьников в первом случае и супружеских пар во втором случае) и две характеристики КАЖДОГО из этих объектов -- тогда можно спрашивать, зависимы они или независимы. (Со всеми оговорками о приближённости, как обычно в статистике). Говоря формально, мы должны иметь две случайные величины, определённые на одном и том же вероятностном пространстве.

Без этого условия (как в данном случае) понятие независимости лишено смысла -- ни формального, ни конкретно-практического (если сомневаетесь, попробуйте сформулировать, какие доли должны совпадать -- и Вы в этом убедитесь!)

Соответственно и "проверочный эксперимент по образованию случайных пар" лишён всякого смысла - проверять тут нечего и картина зависит не от исходных данных (набора значений роста для мальчиков и девочек), а от того, как лягут кости при выборе случайных пар.

Это не отменяет вопроса задачи (почему получилась такая картинка), но нелепости в этой задаче начинаются гораздо раньше. Может, какие-то участники олимпиады их и заметили (а наиболее проницательные могли бы написать, что, по всей видимости, учительница посещала курсы переподготовки по книге Высоцкого, Макарова, Тюрина и Ященко, так что её вины здесь нет:-). Но, как видно из опубликованного на том же сайте (в качестве правильного) решения, составители задач ничего этого не заметили.

Грустно.

Previous post Next post
Up