Кластерный анализ

Oct 18, 2008 13:06

Здравствуйте, очень нужна ваша помощь ( Read more... )

Данные: пропуски и их замена, Кластерный анализ

Leave a comment

Comments 4

gorgonops October 18 2008, 09:27:59 UTC
Иерархический и Two-step КА действительно исключают пропуски списочно, т.е. не допускают в анализ строки хотя бы с одним пропуском. Поэтому у вас и допущено 27 вместо 4000 респондентов.

Чтобы посоветовать как вам быть, скажите
1) А какие по типу у вас переменные (количественные или номинальные или смесь тех и других)?
2) Какую из трех процедур КА в SPSS вы используете?

Reply

chaosfall October 18 2008, 09:31:26 UTC
только количественные
методом k-means
я думала о том, чтобы все пропущенные данные преобразовать в 0, но ведь это совсем неправильно будет?(

Reply

gorgonops October 18 2008, 09:38:18 UTC
Так в чем проблема тогда? В K-Means, зайдите в Options и выберите Exclude cases pairwise. И все будет OK.
Альтернативный вариант - заместить пропуски средними значениями (Transform - Replace Missing Values). Более тонкий альтернативный вариант - заместить пропуски методом регрессионной или EM импутации (Analyze - Missing Value Analysis, если этот модуль у вас присутствует).

Reply

chaosfall October 18 2008, 09:44:45 UTC
спасибо!

Reply


Leave a comment

Up