Пишу про распространённые студенческие ошибки в работе со статистикой

Mar 09, 2016 09:41

По опыту хождения на защиты курсовых и дипломных работ по психологии подметил ряд распространённых и коварных ошибок в работах. Задумал черкнуть текст, предостерегающий от таких ошибок. Буду благодарен, если специалисты по статистике проверят.

Чтобы не вываливать сразу много, пока первые пять пунктов.

Read more... )

Общие принципы статистики, Заблуждения в статистике

Leave a comment

gorgonops March 9 2016, 06:37:56 UTC
Вот здесь http://stats.stackexchange.com/q/4551/3277 можно почерпнуть много интересного, самые принципиальные общие заблуждения ( ... )

Reply

carpodacus March 9 2016, 08:43:59 UTC
1) Так ведь речь и идёт про студента, который ошибается со статистической частью работы. И, увы, даже не на семинаре и экзамене, а уже на защите.

Обычно это выглядит так. Студент наслышан, что для чего-то там в данных нужна нормальность. Он берёт и закидывает всю выборку своего исследования в тест Колмогорова-Смирнова. Получает p-значение, допустим 0,200 (предположим, что это достаточно большая выборка, чтобы сюда не относился случай 1). Торжествующе пишет, что данные имеют нормальное распределение и идёт делать любые параметрические методы. То есть принцип, где именно должно быть нормальное распределения для применения параметрической статистики, он не понимает. Более того, я встречал работы, где студент проверял на нормальность, а находя её - говорил, что идёт делать, скажем, Манна-Уитни. То есть делал проверку на нормальность просто потому, что так типа надо.
Вот об этой ситуации речь.

Reply

polryby4 March 11 2016, 22:10:03 UTC
"...а уже на защите" - так тут вопросы должны быть не к студенту, а к его руководителю. И все описанное Вами студент проделывает потому, что все окружающие поступают так же, и публикаций таких полно. И руководителя, читающего работу, ничего не настораживает.

Reply

carpodacus March 9 2016, 09:16:01 UTC
2) Кроме того, вы сами делаете ошибку, не различая понятия "статистический эффект" и "причинное воздействие ( ... )

Reply

carpodacus March 9 2016, 09:45:46 UTC
Откорректировал мысль. Как теперь?

5. Выявляя взаимосвязь, корреляционный анализ позволяет доказать, что две переменные взаимно действуют друг на друга. Слово «взаимосвязь» регулярно появляется в работах, организация которых не позволяет найти причин и следствий. Студенты обычно в курсе, что корреляция не означает «влияния», это слово они предусмотрительно и заменяют «взаимосвязью ( ... )

Reply

gorgonops March 9 2016, 11:07:53 UTC
--> Можно, я разъясню...
Где-то согласен, но мне не нравится "лишь как вычислительный приём". Регрессия моделирует воздействие X->Y. Если она подтверждает это воздействие (статистически), то это довод в пользу вашей теории, что в реальности имеет место X->Y. Но это не довод против теории, что в реальности воздействие обратное X<-Y. Только ваша методология, а также здравый смысл, дают уверенность, что направленность в реальности именно X->Y, а не наоборот. Регрессия моделировала эту направленность и именно ее, но не опровергала обратную направленность.

--> Что касается корреляции как взаимосвязи...
Если теория / здравый смысл утверждает, что именно X->Y, а не X<-Y или Z->X,Y возможно в реальности, то использование симметричной корреляции (вроде r Пирсона), устанавливающей связь X~Y, достаточно для вывода о присутствии X->Y в реальности. И не требуется регрессия. Поэтому то, что "говорят студенты", не всегда некорректно. Другое дело, если (1) теория / здравый смысл шире допускает, что возможно в реальности и X<-Y или Z->X,Y; или если ( ( ... )

Reply


Leave a comment

Up