Comments | ru_spss: Ограничения по выборке на U-критерий Манна-Уитни

volokhonsky in ru_spss

Ограничения по выборке на U-критерий Манна-Уитни

May 18, 2008 19:23

Регулярно встречаюсь с людьми, которые говорят, что U-критерий не применим к выборкам более 60 человек. В русской Википедии написано аналогичное утверждение. Если я не ошибаюсь, ссылаются они при этом на книгу Сидоренко. По моим представлениям, для больших выборок таблицы нет просто потому, что распределение вполне аппроксимируется к нормальному. ( Read more... )

Шкалы измерения, Распределение статистики выборочное, Критерии/анализ непараметрические, Критерий Манна-Уитни, Допущения/предпосылки статистич., Доверительный интервал/ошибка статистич., Выборка: размер

Comments 22

nokh May 18 2008, 16:54:33 UTC

Чем больше выборка - тем лучше. Всегда. Другое дело, что для этого критерия действительно нет смысла составлять таблицы для больших объемов выборок, т.к. при m+n>60 U-статистика аппроксимируется нормальным распределением:
U(m,n,альфа)=nm/2*z*SQRT((nm(n+m+1)/12), где n и m - объемы выборок, а z - площадь под кривой стандартного норм. распределения. В википедии статья - слабая. Прошел к ней интерес, а то можно было бы поправить: в качестве ограничений приведена какая-то ерунда, а самое принципиальное не написано: критерий предполагает, что распределения в сравниваемых выборках относятся к одинаковому типу.

gorgonops May 18 2008, 17:07:28 UTC

-> относятся к одинаковому типу

Я бы сказал даже не о "типе", а о природе. Если, положим, мы применяем его в психологии к оценкам, полученным по лайкертовской или иной балльной шкале, то предполагается, что искаженность шкалы относительно "внутрипсихической шкалы" испытуемых одинакова между 2-мя выборками; только на этом основании мы имеем право ранжировать оценки 2-х групп в общем ряду.

volokhonsky May 18 2008, 17:11:04 UTC

Э-э, а какая ему разница, если речь идёт о порядковой шкале?

gorgonops May 18 2008, 17:28:10 UTC

В голове шкалы имплицитно континуальны. Субъективное расстояние между баллом 2 и баллом 3 может быть любым (не таким, например как между баллами 4 и 5), но примерно одинаковым для всех респондентов, чтобы внутрипсихически не было таких вещей:
Респондент 1: 1--2-------3-4--5
Респондент 2: 1-2-3--4----5
Другое дело, как этого практически избежать...

Thread 5

gorgonops May 18 2008, 16:56:38 UTC

U хорошо аппроксимируется нормальной кривой уже при n 20, если n в обеих группах примерно одинаковы.

polryby4 May 18 2008, 19:08:28 UTC

Добавлю к вышесказанному, что чем больше в двух выборках одинаковых значений, тем хуже работают ранговые методы. Ну а чем больше выборка, тем больше вероятность таковых значений.

propulsive May 19 2008, 17:21:00 UTC

Хотя распределение U является дискретным, при больших N и M оно может быть аппроксимировано нормальным распределением с математическим ожиданием 0.5·N·M и среднеквадратичным отклонением ( ... )

propulsive May 19 2008, 17:25:07 UTC

лучше смотреть http://en.wikipedia.org/wiki/Mann-Whitney_U_test а в ру вики пишут всякую фигню по матстату и по психологии в частности :)