Jun 07, 2009 19:14
Иногда кейсы необходимо разбить на n кластеров. Результат удобно получить в виде переменной, значения которой указывали бы на принадлежность к тому или иному кластеру (графики, таблицы - будут заведомо перегружены в связи с большим числом кейсов). Кластерное решение нетрудно получить, например, с помощью следующего синтаксиса SPSS:
* Укажите переменные, которые будут участвовать в расчете корреляционной матрицы (анкеты х анкеты).
* В данном случае это переменные var1 - var10.
* Перед вычислениями данные нормируем...
PROXIMITIES var1 TO var10
/VIEW=Case
/MEASURE=RESCALE
/PRINT=NONE
/MATRIX=OUT(TEMPMAT.SAV).
* Корреляционная матрица в файле TEMPMAT.SAV....
* ...в процессе вычислений файл может достигать диковинных размеров...
*....так что открывать его не нужно, если вам сами корреляции не нужны....
EXECUTE.
* Выполним кластерный анализ по методу Варда.
* Число кластеров = 5 (выбираем нужное нам...)
CLUSTER
/METHOD=WARD (CLST)
/SAVE=CLUSTER(5)
/PRINT=NONE
/PLOT=NONE
/MATRIX=IN(TEMPMAT.SAV).
EXECUTE.
* Кластерное решение в данном случае - в переменной CLST5.