Статистического дзена пост, часть 2

Jul 06, 2014 13:01

Вчера я запостил картинку:



выражающую зависимость между средним IQ студентов в группе и долей девушек среди этих студентов. Были предложены пять утверждений, якобы являющиеся результатами философского осмысления графика, предлагалось выбрать среди них истинное. Мнения комментаторов разделились, было предложено еще два утверждения и исторгнуто четыре потока сознания, умеренно близких к теме обсуждения. Однако правильный ответ в заданных условиях однозначен, вот он:
----------
5. Нет оснований полагать, что между полом и IQ студентов нет зависимости.
----------

Только такой вывод можно сделать из приведенного графика, все остальное - пустые домыслы. Статистика устроена так: отсутствие корреляции однозначно говорит об отсутствии причинно-следственной связи, наличие корреляции не говорит ни о чем. Многие люди не понимают этого, отсюда возникает суеверие, что, дескать, есть ложь, есть большая ложь, и есть супермегаложь - статистика.

Если вышесказанное трудно понять, попробуйте помедитировать вот на такой график:



Такие дела.

UPD. В комментариях правильно подсказали, что "отсутствие корреляции" правильно пишется "нулевая корреляция", и в некоторых воображаемых ситуациях корреляция между переменными может быть нулевой даже при наличии жесткой зависимости между ними. На основной вывод эти уточнения не влияют.
Previous post Next post
Up