Кластерное решение в SPSS: sociolstat

sociolstat

Кластерное решение в SPSS

Jun 07, 2009 19:14

Иногда кейсы необходимо разбить на n кластеров. Результат удобно получить в виде переменной, значения которой указывали бы на принадлежность к тому или иному кластеру (графики, таблицы - будут заведомо перегружены в связи с большим числом кейсов). Кластерное решение нетрудно получить, например, с помощью следующего синтаксиса SPSS:

* Укажите переменные, которые будут участвовать в расчете корреляционной матрицы (анкеты х анкеты).
* В данном случае это переменные var1 - var10.
* Перед вычислениями данные нормируем...

PROXIMITIES var1 TO var10
/VIEW=Case
/MEASURE=RESCALE
/PRINT=NONE
/MATRIX=OUT(TEMPMAT.SAV).

* Корреляционная матрица в файле TEMPMAT.SAV....
* ...в процессе вычислений файл может достигать диковинных размеров...
*....так что открывать его не нужно, если вам сами корреляции не нужны....

EXECUTE.

* Выполним кластерный анализ по методу Варда.
* Число кластеров = 5 (выбираем нужное нам...)

CLUSTER
/METHOD=WARD (CLST)
/SAVE=CLUSTER(5)
/PRINT=NONE
/PLOT=NONE
/MATRIX=IN(TEMPMAT.SAV).

EXECUTE.

* Кластерное решение в данном случае - в переменной CLST5.