1) потому что это выбор разработчиков, посчитавших необходимым свести вместе коэффициенты для некатегиальных данных 2) потому что значимость в случае введения поправки можно посчитать только асимптотически 3) посмотрите в алгоритмы -- подсчет ведется совсем не по формуле Пирсона, поскольку ро учитывает связанные ранги, так что формула скорее близка к классической упрощенной для ручных подсчетов
Если в SPSS заменить исходные значения переменных рангами (Rank Cases...), и затем посчитать корреляции Пирсона, то они будут равны корреляциям Спирмена для тех же данных (до ранжирования). И так всегда, хоть ты тресни :-))
Re: придется треснутьalexwin1961April 20 2008, 08:31:58 UTC
> А зачем "weight by W"? Мы этим не пользуемся:-) Ну и зря. А социологи и маркетологи пользуются этим сплошь и рядом, потому что вопросы репрезентативности выборки их волнуют :). Этим примером я просто проиллюстрировал вобщем-то непреложный факт: в СПСС для подсчета ро используется не формула Пирсона, а (как и описано в алгоритмах), иной подход. Практически всегда обе дают одинаковый результат, но, как видите, не всегда.
Re: придется треснутьalexwin1961April 21 2008, 04:21:04 UTC
а, понял, что Вы имели в виду. Вы умножили значения X и Y на весовые коэффициенты, но это неверное понимание взвешивания. Веса указывают, сколько раз "повторяется" наблюдение, оказывая влияние на общий результат. Так, первый респондент повторяется 1.2 раза, а последний -- 2.1
Re: придется треснутьsociolstatApril 21 2008, 06:28:34 UTC
Да, мой ручной взвес неверен. Читаю Крыштановского и Кузнецова о перевзвешивании. Мне представляется, что отличие коэффициентов корреляции Спирмена и Пирсона (для рангов) определенно обусловлено в Вашем исходном синтаксисе процедурой взвешивания, а не какой-либо иной поправкой.
Re: придется треснутьalexwin1961April 21 2008, 08:05:02 UTC
повторю еще раз (так будет убедительнее, верно?): в алоритмах к пакету СПСС четко указано, каким образом считается ро. Это упрошенная формула для ручного счета, а не коэф. Пирсона для рангов. Именно для случая, когда мы взвешиваем данные, это становится очевидным. При отсутствии взвешивания результаты двух формул эквивалентны
Re: придется треснутьgorgonopsApril 21 2008, 08:50:22 UTC
NONPAR CORR округляет веса и после считает "не по формуле Пирсона". Это легко увидеть также в CROSSTABS: CROSSTABS /TABLES= RX BY RY /STATISTIC= CORR /COUNT ROUND CASE . Но оставление весов неокругленными в CROSSTABS дало одинаковые значения для обоих коэф-тов: CROSSTABS /TABLES=RX BY RY /STATISTIC= CORR /COUNT ASIS. Не ставши разбираться в алгоритмах CROSSTABS (кстати сказать, многие алгоритмы в SPSS грешат неполнотой, умолчаниями...), подозреваю, что при /COUNT ASIS программа пользуется-таки формулой Пирсона для вычисления Спирмена. Как думаете?
Re: придется треснутьalexwin1961April 21 2008, 12:04:49 UTC
Да, точно, алгоритм для CROSSTABS использует как раз формулу Пирсона. The formulas for rs and its asymptotic variance can be obtained from the Pearson formulas by substituting Ri and Cj for Xi and Yj, respectively.
ВЫВОД: Спирмен перед расчетом округляет веса, Пирсон же "грамотно приводит" к целым значениям - в данном случае домножает веса на 10. Таким образом, с Вашим тезисом о том, что используется какая-то упрошенная формула для ручного счета, а не коэф. Пирсона для рангов, согласиться не могу. Как я уже говорил суть в непрозрачной схеме взвеса.
Re: придется треснутьgorgonopsApril 23 2008, 14:23:55 UTC
Извините что встреваю. "Непрозрачность" вполне прозрачна: При расчете Спирмена в NONPAR CORR, сначала веса округляются, потом делается ранжирование, потом используется ф-ла, которая там (в алгоритме) НАПИСАНА, и это не ф-ла r Пирсона, если верить глазам. Другое дело, вы правы, что alexwin1961'у не удалось своим синтаксисом доказать, что эта ф-ла может приводить к иным результатам чем применение ф-лы Пирсона (по кр. мере, его синтаксис не округлил веса до ранжирования).
Re: придется треснутьsociolstatApril 23 2008, 15:01:48 UTC
Коллеги, разъясните мне, пожалуйста, при каких обстоятельствах эта "другая", "упрощенная", "ручная" формула демонстрирует цифровые отличия после процедуры ранжирования от ф-лы Пирсона. Мне важно, я пишу алгоритм. Спасибо! Я полагаю, что мой эксперимент показал, что различия коэффициентов, рассчитанных с помощью синтаксиса Александра, обусловлены округлением и ни чем иным.
Re: придется треснутьgorgonopsApril 23 2008, 15:08:27 UTC
Мне не встречались ситуации, когда "ручная" формула давала бы иные результаты чем ф-ла Пирсона (и я привык думать, как и вы, что "Спирмен это Пирсон на рангах"). Впрочем, я и не искал конкретно таких ситуаций.
2) потому что значимость в случае введения поправки можно посчитать только асимптотически
3) посмотрите в алгоритмы -- подсчет ведется совсем не по формуле Пирсона, поскольку ро учитывает связанные ранги, так что формула скорее близка к классической упрощенной для ручных подсчетов
Reply
Reply
data list free / X Y W.
begin data.
1 3 1.2
2 3 3.1
2 1 1.2
2 3 1.7
4 3 2.1
end data.
weight by W.
RANK
VARIABLES=X Y (A) /RANK /TIES=MEAN.
COR RX WITH RY.
NONPAR CORR
/VARIABLES=X Y
/PRINT=SPEARMAN TWOTAIL NOSIG
/MISSING=PAIRWISE .
Reply
А если без "взвешивания"?
Reply
Ну и зря. А социологи и маркетологи пользуются этим сплошь и рядом, потому что вопросы репрезентативности выборки их волнуют :). Этим примером я просто проиллюстрировал вобщем-то непреложный факт: в СПСС для подсчета ро используется не формула Пирсона, а (как и описано в алгоритмах), иной подход. Практически всегда обе дают одинаковый результат, но, как видите, не всегда.
Reply
data list free / X Y.
begin data.
1 3
2 3
2 1
2 3
4 3
end data.
RANK
VARIABLES=X Y (A) /RANK /TIES=MEAN.
COR RX WITH RY.
NONPAR CORR
/VARIABLES=X Y
/PRINT=SPEARMAN TWOTAIL NOSIG
/MISSING=PAIRWISE .
0 = 0. Процедура взвешивания работает непрозрачно.
Мой ручной взвес по Вашей переменной:
1,20 3,60
6,20 9,30
2,40 1,20
3,40 5,10
8,40 6,30
Применяем к этим данным Спирмена = 0,8
Ранжируем, а потом Пирсона = 0,8
Значимость везде 0,104
Как в Вашем синтаксисе работает взвес? В чем дело?
Reply
0 = 0. Процедура взвешивания работает непрозрачно.
???
Мой ручной взвес по Вашей переменной:
1,20 3,60
6,20 9,30
2,40 1,20
3,40 5,10
8,40 6,30
Что такое "ручной взвес"? По какой переменной (кроме X Y в данных ничего больше нет)?
Reply
Reply
Мне представляется, что отличие коэффициентов корреляции Спирмена и Пирсона (для рангов) определенно обусловлено в Вашем исходном синтаксисе процедурой взвешивания, а не какой-либо иной поправкой.
Reply
Reply
CROSSTABS
/TABLES= RX BY RY
/STATISTIC= CORR
/COUNT ROUND CASE .
Но оставление весов неокругленными в CROSSTABS дало одинаковые значения для обоих коэф-тов:
CROSSTABS
/TABLES=RX BY RY
/STATISTIC= CORR
/COUNT ASIS.
Не ставши разбираться в алгоритмах CROSSTABS (кстати сказать, многие алгоритмы в SPSS грешат неполнотой, умолчаниями...), подозреваю, что при /COUNT ASIS программа пользуется-таки формулой Пирсона для вычисления Спирмена. Как думаете?
Reply
Reply
1) Ваш вариант:
1 3 1.2
2 3 3.1
2 1 1.2
2 3 1.7
4 3 2.1
P(Pearson)=0,76
S(Spearman)=0,82
2)
1 3 12
2 3 31
2 1 12
2 3 17
4 3 21
P=0,76
S=0,76
3) Математическое округление весов:
1 3 1
2 3 3
2 1 1
2 3 2
4 3 2
P=0,82
S=0,82
4)
1 3 10
2 3 30
2 1 10
2 3 20
4 3 20
P=0,82
S=0,82
ВЫВОД: Спирмен перед расчетом округляет веса, Пирсон же "грамотно приводит" к целым значениям - в данном случае домножает веса на 10.
Таким образом, с Вашим тезисом о том, что используется какая-то упрошенная формула для ручного счета, а не коэф. Пирсона для рангов, согласиться не могу.
Как я уже говорил суть в непрозрачной схеме взвеса.
Reply
Reply
Я полагаю, что мой эксперимент показал, что различия коэффициентов, рассчитанных с помощью синтаксиса Александра, обусловлены округлением и ни чем иным.
Reply
Reply
Leave a comment