Так это почему-то проходит мимо многих хороших курсов статистики. Даже в тех, где обсуждается важность размера эффекта для его выявления.
У нас был случай, когда студентка не то на курсовой, не то на дипломе придумывала всякие неочевидные гипотеза для объяснения корреляции, которая у нее оказалась значимой. И только на защите ей сказали, что у нее корреляций равна 0,01 (или около того) - при ее выборке в несколько тысяч она оказалась значимой, но только в статистическом смысле.
Потому что, наверно, это не в компетенции статистиков - биологическую важность оценивать. Они про свое учат, про доверительные интервалы и про p values.
Но значительная часть учебников по биостатистике пишется все-таки биологами. Конечно, биологическая значимость, в отличие от статистической - неформализуема. Но хотя бы указать на проблему...
Вот ниже в комментариях пишут, что в "хороших учебниках по доказательной медицине" об этом пишут. Хорошо, если так.
вот именно поэтому статистику(в смысле анализ данных) естественнонаучным студентам должны преподавать сведующие в анализе данных специалисты именно той самой области естественнонаучных знаний. а статистики( в смысле математической статистики) нужны для преподавать математическим студентам и аспирантам только. тут может возникнут вопрос: а куда же девать избыток освободившихся матстатистиков? а работать пускай идут. в макдоналдс или еще куда их если возьмут, мне не интересны эти детали
мат.статистика она одинакова, что для гренландских китов, что для антарктических бактерий, и с чего это ее должны преподавать не математики, которые лучше её понимают ?
(Как/где статистику применять, качество входных данных - это понятно уже может быть специфично для области естественнонаучных знаний.)
Какую/где статистику применять и как обеспечить нормальное качество входных данных -- это единственное, чему надо научиться будущему условному микробиологу. А дальше он выберет нужный пункт в меню компьютерной программы и получит ответ: да или нет.
Источник проблемы не в том, что матстатистик не знает этих нюансов из предметной область. Он мог бы выучить, даже медведь можно научиться на велосипеде ездить. Но он не хочет. Он в них тычет сокращенный и упрощенный, до потери всякого смысла, курс матстатистики. Слегка лишь разбавленный прикладными примерами из старинных учебников.
Везде, где я сталкивался со статистикой от статистиков, обязательно делался акцент на 2 несинонимичных параметра: significance и effect size. Большинство публикаций, где effect size обходится стороной, а значимость тупо набирается количеством экспериментов/пациентов происходит как раз от биологов-медиков-химиков.
Тут еще другой аспект накладывается - в биологии иногда 10% разницы очень важны, а иногда изменение в 10 раз погоды не делает. Т.е. effect size и важность - вещи разные.
Разумеется, трактовка сего должна лежать на стороне конкретного специалиста. Моя ремарка касалась лишь того, что статистики на самом деле прекрасно знают и постоянно указывают на недопустимость руководствоваться только p-value или только effect size.
А если уж совсем по-хорошему (это, в принципе, всегда есть в данных, но очень редко бывает в трактовках в СМИ) нужно еще и доверительный интервал показывать.
У нас был случай, когда студентка не то на курсовой, не то на дипломе придумывала всякие неочевидные гипотеза для объяснения корреляции, которая у нее оказалась значимой. И только на защите ей сказали, что у нее корреляций равна 0,01 (или около того) - при ее выборке в несколько тысяч она оказалась значимой, но только в статистическом смысле.
Reply
Reply
Конечно, биологическая значимость, в отличие от статистической - неформализуема. Но хотя бы указать на проблему...
Вот ниже в комментариях пишут, что в "хороших учебниках по доказательной медицине" об этом пишут. Хорошо, если так.
Reply
Reply
мат.статистика она одинакова, что для гренландских китов, что для антарктических бактерий, и с чего это ее должны преподавать не математики, которые лучше её понимают ?
(Как/где статистику применять, качество входных данных - это понятно уже может быть специфично для области естественнонаучных знаний.)
Reply
Источник проблемы не в том, что матстатистик не знает этих нюансов из предметной область. Он мог бы выучить, даже медведь можно научиться на велосипеде ездить. Но он не хочет. Он в них тычет сокращенный и упрощенный, до потери всякого смысла, курс матстатистики. Слегка лишь разбавленный прикладными примерами из старинных учебников.
Reply
Везде, где я сталкивался со статистикой от статистиков, обязательно делался акцент на 2 несинонимичных параметра: significance и effect size. Большинство публикаций, где effect size обходится стороной, а значимость тупо набирается количеством экспериментов/пациентов происходит как раз от биологов-медиков-химиков.
Reply
Reply
Reply
А если уж совсем по-хорошему (это, в принципе, всегда есть в данных, но очень редко бывает в трактовках в СМИ) нужно еще и доверительный интервал показывать.
Reply
Leave a comment