Comments | ru_spss: Kendall's tau

sociolstat in ru_spss

Kendall's tau

Apr 18, 2008 19:24

1) Кто-нибудь знает почему в SPSS через Analyze->Correlate->Bivariate... можно посчитать Kendall's tau-b, но нельзя посчитать, скажем ( Read more... )

Статистики на базе гаммы (тау/Соммер..), Корреляция ранговая, Корреляция линейная Пирсона, Корреляция Спирмена, Данные: взвешивание, Критерии для таблиц сопряженности, Корреляция Кендалла

Leave a comment

Back to all threads

alexwin1961 April 19 2008, 14:03:14 UTC

1) потому что это выбор разработчиков, посчитавших необходимым свести вместе коэффициенты для некатегиальных данных
2) потому что значимость в случае введения поправки можно посчитать только асимптотически
3) посмотрите в алгоритмы -- подсчет ведется совсем не по формуле Пирсона, поскольку ро учитывает связанные ранги, так что формула скорее близка к классической упрощенной для ручных подсчетов

adn1 April 19 2008, 20:55:54 UTC

Если в SPSS заменить исходные значения переменных рангами (Rank Cases...), и затем посчитать корреляции Пирсона, то они будут равны корреляциям Спирмена для тех же данных (до ранжирования). И так всегда, хоть ты тресни :-))

придется треснуть alexwin1961 April 19 2008, 22:09:49 UTC

А попробуйте вот это:

data list free / X Y W.
begin data.
1 3 1.2
2 3 3.1
2 1 1.2
2 3 1.7
4 3 2.1
end data.

weight by W.

RANK
VARIABLES=X Y (A) /RANK /TIES=MEAN.

COR RX WITH RY.

NONPAR CORR
/VARIABLES=X Y
/PRINT=SPEARMAN TWOTAIL NOSIG
/MISSING=PAIRWISE .

Re: придется треснуть adn1 April 20 2008, 02:56:33 UTC

А зачем "weight by W"? Мы этим не пользуемся:-)
А если без "взвешивания"?

Re: придется треснуть alexwin1961 April 20 2008, 08:31:58 UTC

> А зачем "weight by W"? Мы этим не пользуемся:-)
Ну и зря. А социологи и маркетологи пользуются этим сплошь и рядом, потому что вопросы репрезентативности выборки их волнуют :). Этим примером я просто проиллюстрировал вобщем-то непреложный факт: в СПСС для подсчета ро используется не формула Пирсона, а (как и описано в алгоритмах), иной подход. Практически всегда обе дают одинаковый результат, но, как видите, не всегда.

Re: придется треснуть sociolstat April 20 2008, 18:24:14 UTC

Александр, запустил вот что:

data list free / X Y.
begin data.
1 3
2 3
2 1
2 3
4 3
end data.

RANK
VARIABLES=X Y (A) /RANK /TIES=MEAN.

COR RX WITH RY.

NONPAR CORR
/VARIABLES=X Y
/PRINT=SPEARMAN TWOTAIL NOSIG
/MISSING=PAIRWISE .

0 = 0. Процедура взвешивания работает непрозрачно.

Мой ручной взвес по Вашей переменной:
1,20 3,60
6,20 9,30
2,40 1,20
3,40 5,10
8,40 6,30

Применяем к этим данным Спирмена = 0,8
Ранжируем, а потом Пирсона = 0,8
Значимость везде 0,104

Как в Вашем синтаксисе работает взвес? В чем дело?

Re: придется треснуть alexwin1961 April 20 2008, 20:03:47 UTC

Вот эту часть не понял:

0 = 0. Процедура взвешивания работает непрозрачно.
???

Мой ручной взвес по Вашей переменной:
1,20 3,60
6,20 9,30
2,40 1,20
3,40 5,10
8,40 6,30

Что такое "ручной взвес"? По какой переменной (кроме X Y в данных ничего больше нет)?

Re: придется треснуть alexwin1961 April 21 2008, 04:21:04 UTC

а, понял, что Вы имели в виду. Вы умножили значения X и Y на весовые коэффициенты, но это неверное понимание взвешивания. Веса указывают, сколько раз "повторяется" наблюдение, оказывая влияние на общий результат. Так, первый респондент повторяется 1.2 раза, а последний -- 2.1

Re: придется треснуть sociolstat April 21 2008, 06:28:34 UTC

Да, мой ручной взвес неверен. Читаю Крыштановского и Кузнецова о перевзвешивании.
Мне представляется, что отличие коэффициентов корреляции Спирмена и Пирсона (для рангов) определенно обусловлено в Вашем исходном синтаксисе процедурой взвешивания, а не какой-либо иной поправкой.

Re: придется треснуть alexwin1961 April 21 2008, 08:05:02 UTC

повторю еще раз (так будет убедительнее, верно?): в алоритмах к пакету СПСС четко указано, каким образом считается ро. Это упрошенная формула для ручного счета, а не коэф. Пирсона для рангов. Именно для случая, когда мы взвешиваем данные, это становится очевидным. При отсутствии взвешивания результаты двух формул эквивалентны

Re: придется треснуть gorgonops April 21 2008, 08:50:22 UTC

NONPAR CORR округляет веса и после считает "не по формуле Пирсона". Это легко увидеть также в CROSSTABS:
CROSSTABS
/TABLES= RX BY RY
/STATISTIC= CORR
/COUNT ROUND CASE .
Но оставление весов неокругленными в CROSSTABS дало одинаковые значения для обоих коэф-тов:
CROSSTABS
/TABLES=RX BY RY
/STATISTIC= CORR
/COUNT ASIS.
Не ставши разбираться в алгоритмах CROSSTABS (кстати сказать, многие алгоритмы в SPSS грешат неполнотой, умолчаниями...), подозреваю, что при /COUNT ASIS программа пользуется-таки формулой Пирсона для вычисления Спирмена. Как думаете?

Re: придется треснуть alexwin1961 April 21 2008, 12:04:49 UTC

Да, точно, алгоритм для CROSSTABS использует как раз формулу Пирсона. The formulas for rs and its asymptotic variance can be obtained from the Pearson formulas by substituting Ri and Cj for Xi and Yj, respectively.

Re: придется треснуть sociolstat April 23 2008, 10:39:30 UTC

Александр, я с Вашим синтаксисом сегодня несколько экспериментов поставил.

1) Ваш вариант:

1 3 1.2
2 3 3.1
2 1 1.2
2 3 1.7
4 3 2.1

P(Pearson)=0,76
S(Spearman)=0,82

2)
1 3 12
2 3 31
2 1 12
2 3 17
4 3 21

P=0,76
S=0,76

3) Математическое округление весов:
1 3 1
2 3 3
2 1 1
2 3 2
4 3 2

P=0,82
S=0,82

4)
1 3 10
2 3 30
2 1 10
2 3 20
4 3 20

P=0,82
S=0,82

ВЫВОД: Спирмен перед расчетом округляет веса, Пирсон же "грамотно приводит" к целым значениям - в данном случае домножает веса на 10.
Таким образом, с Вашим тезисом о том, что используется какая-то упрошенная формула для ручного счета, а не коэф. Пирсона для рангов, согласиться не могу.
Как я уже говорил суть в непрозрачной схеме взвеса.

Re: придется треснуть gorgonops April 23 2008, 14:23:55 UTC

Извините что встреваю. "Непрозрачность" вполне прозрачна: При расчете Спирмена в NONPAR CORR, сначала веса округляются, потом делается ранжирование, потом используется ф-ла, которая там (в алгоритме) НАПИСАНА, и это не ф-ла r Пирсона, если верить глазам. Другое дело, вы правы, что alexwin1961'у не удалось своим синтаксисом доказать, что эта ф-ла может приводить к иным результатам чем применение ф-лы Пирсона (по кр. мере, его синтаксис не округлил веса до ранжирования).

Re: придется треснуть sociolstat April 23 2008, 15:01:48 UTC

Коллеги, разъясните мне, пожалуйста, при каких обстоятельствах эта "другая", "упрощенная", "ручная" формула демонстрирует цифровые отличия после процедуры ранжирования от ф-лы Пирсона. Мне важно, я пишу алгоритм. Спасибо!
Я полагаю, что мой эксперимент показал, что различия коэффициентов, рассчитанных с помощью синтаксиса Александра, обусловлены округлением и ни чем иным.

Re: придется треснуть gorgonops April 23 2008, 15:08:27 UTC

Мне не встречались ситуации, когда "ручная" формула давала бы иные результаты чем ф-ла Пирсона (и я привык думать, как и вы, что "Спирмен это Пирсон на рангах"). Впрочем, я и не искал конкретно таких ситуаций.

Back to all threads