Kendall's tau

Apr 18, 2008 19:24

1) Кто-нибудь знает почему в SPSS через Analyze->Correlate->Bivariate... можно посчитать Kendall's tau-b, но нельзя посчитать, скажем ( Read more... )

Статистики на базе гаммы (тау/Соммер..), Корреляция ранговая, Корреляция линейная Пирсона, Корреляция Спирмена, Данные: взвешивание, Критерии для таблиц сопряженности, Корреляция Кендалла

Leave a comment

alexwin1961 April 19 2008, 14:03:14 UTC
1) потому что это выбор разработчиков, посчитавших необходимым свести вместе коэффициенты для некатегиальных данных
2) потому что значимость в случае введения поправки можно посчитать только асимптотически
3) посмотрите в алгоритмы -- подсчет ведется совсем не по формуле Пирсона, поскольку ро учитывает связанные ранги, так что формула скорее близка к классической упрощенной для ручных подсчетов

Reply

adn1 April 19 2008, 20:55:54 UTC
Если в SPSS заменить исходные значения переменных рангами (Rank Cases...), и затем посчитать корреляции Пирсона, то они будут равны корреляциям Спирмена для тех же данных (до ранжирования). И так всегда, хоть ты тресни :-))

Reply

придется треснуть alexwin1961 April 19 2008, 22:09:49 UTC
А попробуйте вот это:

data list free / X Y W.
begin data.
1 3 1.2
2 3 3.1
2 1 1.2
2 3 1.7
4 3 2.1
end data.

weight by W.

RANK
VARIABLES=X Y (A) /RANK /TIES=MEAN.

COR RX WITH RY.

NONPAR CORR
/VARIABLES=X Y
/PRINT=SPEARMAN TWOTAIL NOSIG
/MISSING=PAIRWISE .

Reply

Re: придется треснуть adn1 April 20 2008, 02:56:33 UTC
А зачем "weight by W"? Мы этим не пользуемся:-)
А если без "взвешивания"?

Reply

Re: придется треснуть alexwin1961 April 20 2008, 08:31:58 UTC
> А зачем "weight by W"? Мы этим не пользуемся:-)
Ну и зря. А социологи и маркетологи пользуются этим сплошь и рядом, потому что вопросы репрезентативности выборки их волнуют :). Этим примером я просто проиллюстрировал вобщем-то непреложный факт: в СПСС для подсчета ро используется не формула Пирсона, а (как и описано в алгоритмах), иной подход. Практически всегда обе дают одинаковый результат, но, как видите, не всегда.

Reply

Re: придется треснуть sociolstat April 20 2008, 18:24:14 UTC
Александр, запустил вот что:

data list free / X Y.
begin data.
1 3
2 3
2 1
2 3
4 3
end data.

RANK
VARIABLES=X Y (A) /RANK /TIES=MEAN.

COR RX WITH RY.

NONPAR CORR
/VARIABLES=X Y
/PRINT=SPEARMAN TWOTAIL NOSIG
/MISSING=PAIRWISE .

0 = 0. Процедура взвешивания работает непрозрачно.

Мой ручной взвес по Вашей переменной:
1,20 3,60
6,20 9,30
2,40 1,20
3,40 5,10
8,40 6,30

Применяем к этим данным Спирмена = 0,8
Ранжируем, а потом Пирсона = 0,8
Значимость везде 0,104

Как в Вашем синтаксисе работает взвес? В чем дело?

Reply

Re: придется треснуть alexwin1961 April 20 2008, 20:03:47 UTC
Вот эту часть не понял:

0 = 0. Процедура взвешивания работает непрозрачно.
???

Мой ручной взвес по Вашей переменной:
1,20 3,60
6,20 9,30
2,40 1,20
3,40 5,10
8,40 6,30

Что такое "ручной взвес"? По какой переменной (кроме X Y в данных ничего больше нет)?

Reply

Re: придется треснуть alexwin1961 April 21 2008, 04:21:04 UTC
а, понял, что Вы имели в виду. Вы умножили значения X и Y на весовые коэффициенты, но это неверное понимание взвешивания. Веса указывают, сколько раз "повторяется" наблюдение, оказывая влияние на общий результат. Так, первый респондент повторяется 1.2 раза, а последний -- 2.1

Reply

Re: придется треснуть sociolstat April 21 2008, 06:28:34 UTC
Да, мой ручной взвес неверен. Читаю Крыштановского и Кузнецова о перевзвешивании.
Мне представляется, что отличие коэффициентов корреляции Спирмена и Пирсона (для рангов) определенно обусловлено в Вашем исходном синтаксисе процедурой взвешивания, а не какой-либо иной поправкой.

Reply

Re: придется треснуть alexwin1961 April 21 2008, 08:05:02 UTC
повторю еще раз (так будет убедительнее, верно?): в алоритмах к пакету СПСС четко указано, каким образом считается ро. Это упрошенная формула для ручного счета, а не коэф. Пирсона для рангов. Именно для случая, когда мы взвешиваем данные, это становится очевидным. При отсутствии взвешивания результаты двух формул эквивалентны

Reply

Re: придется треснуть gorgonops April 21 2008, 08:50:22 UTC
NONPAR CORR округляет веса и после считает "не по формуле Пирсона". Это легко увидеть также в CROSSTABS:
CROSSTABS
/TABLES= RX BY RY
/STATISTIC= CORR
/COUNT ROUND CASE .
Но оставление весов неокругленными в CROSSTABS дало одинаковые значения для обоих коэф-тов:
CROSSTABS
/TABLES=RX BY RY
/STATISTIC= CORR
/COUNT ASIS.
Не ставши разбираться в алгоритмах CROSSTABS (кстати сказать, многие алгоритмы в SPSS грешат неполнотой, умолчаниями...), подозреваю, что при /COUNT ASIS программа пользуется-таки формулой Пирсона для вычисления Спирмена. Как думаете?

Reply

Re: придется треснуть alexwin1961 April 21 2008, 12:04:49 UTC
Да, точно, алгоритм для CROSSTABS использует как раз формулу Пирсона. The formulas for rs and its asymptotic variance can be obtained from the Pearson formulas by substituting Ri and Cj for Xi and Yj, respectively.

Reply

Re: придется треснуть sociolstat April 23 2008, 10:39:30 UTC
Александр, я с Вашим синтаксисом сегодня несколько экспериментов поставил.

1) Ваш вариант:

1 3 1.2
2 3 3.1
2 1 1.2
2 3 1.7
4 3 2.1

P(Pearson)=0,76
S(Spearman)=0,82

2)
1 3 12
2 3 31
2 1 12
2 3 17
4 3 21

P=0,76
S=0,76

3) Математическое округление весов:
1 3 1
2 3 3
2 1 1
2 3 2
4 3 2

P=0,82
S=0,82

4)
1 3 10
2 3 30
2 1 10
2 3 20
4 3 20

P=0,82
S=0,82

ВЫВОД: Спирмен перед расчетом округляет веса, Пирсон же "грамотно приводит" к целым значениям - в данном случае домножает веса на 10.
Таким образом, с Вашим тезисом о том, что используется какая-то упрошенная формула для ручного счета, а не коэф. Пирсона для рангов, согласиться не могу.
Как я уже говорил суть в непрозрачной схеме взвеса.

Reply

Re: придется треснуть gorgonops April 23 2008, 14:23:55 UTC
Извините что встреваю. "Непрозрачность" вполне прозрачна: При расчете Спирмена в NONPAR CORR, сначала веса округляются, потом делается ранжирование, потом используется ф-ла, которая там (в алгоритме) НАПИСАНА, и это не ф-ла r Пирсона, если верить глазам. Другое дело, вы правы, что alexwin1961'у не удалось своим синтаксисом доказать, что эта ф-ла может приводить к иным результатам чем применение ф-лы Пирсона (по кр. мере, его синтаксис не округлил веса до ранжирования).

Reply

Re: придется треснуть sociolstat April 23 2008, 15:01:48 UTC
Коллеги, разъясните мне, пожалуйста, при каких обстоятельствах эта "другая", "упрощенная", "ручная" формула демонстрирует цифровые отличия после процедуры ранжирования от ф-лы Пирсона. Мне важно, я пишу алгоритм. Спасибо!
Я полагаю, что мой эксперимент показал, что различия коэффициентов, рассчитанных с помощью синтаксиса Александра, обусловлены округлением и ни чем иным.

Reply

Re: придется треснуть gorgonops April 23 2008, 15:08:27 UTC
Мне не встречались ситуации, когда "ручная" формула давала бы иные результаты чем ф-ла Пирсона (и я привык думать, как и вы, что "Спирмен это Пирсон на рангах"). Впрочем, я и не искал конкретно таких ситуаций.

Reply


Leave a comment

Up