Как сгруппировать переменные

Jun 26, 2013 14:51

Добрый день, уважаемые профессионалы. Очень нужна ваша помощь ( Read more... )

Переменные: двоичные (бинарные), Классификация без учителя, Кластерный анализ

Leave a comment

Comments 9

kovla June 26 2013, 14:12:36 UTC
Вообще-то это анализ латентных классов должен быть, но в СПСС его нету насколько мне известно. Возможно, от вас ожидают кластерный анализ.

Reply

melon_di June 26 2013, 14:19:14 UTC
Спасибо. Вопрос следующий, а как сделать кластерный анализ с этими данными?Все 20 переменных туда отправить? При этом использовать иерархический кластерный анализ методом полной связи?или Варда? А какой метод расчета мер расстояния и сходства выбирать?! Я не сильна в СПСС, к сожалению...((

Reply

gorgonops June 26 2013, 14:38:02 UTC
Звучит так, что вы не в SPSS не сильны, а анализ данных вообще не знаете, и будто ждете что кто-то разжует и в рот положит. Попробуйте хотя бы почитать записи в этом сообществе с меткой "кластерный анализ", в особенности в сочетании с меткой "Переменные: двоичные".

Reply

melon_di June 26 2013, 15:00:11 UTC
Спасибо за отклик. Ну если бы была сильна, наверное не просила бы о помощи?! Занимаюсь самообучением, поэтому вопросов больше, чем ответов (особенно по существу). В интернете при описании мер расстояния и сходства везде только формулы, а как разобраться какой из них применить?! Может, конечно, я не там смотрю=)
Посмотрю еще раз здесь!

Reply


nokh June 26 2013, 19:11:06 UTC
Задача из разряда "творческих", можно решать по-разному. Первое что приходит - множественный анализ соответствий (анализ - снижение размерности - оптимальное шкалирование - по умолчанию). Мне этот анализ не слишком нравится степенью интерпретируемости результатов, но они, безусловно, неплохо интерпретируются + это - классика. В результате редукции данных с обобщением окажется, что несколько первых размерностей объяснят существенную долю изменчивости показателей, которая в этой технике традиционно называется не дисперсией, а инерцией. Несколько первых размерностей будут содержать паттерны показателей, которые вы сможете интерпретировать. Нужно просить пакет рассчитать метки (scores) этих размерностей для всего народа и на этих метках выполнить далее кластеризацию. Про кластерный анализ здесь, действительно, было написано немало, в т.ч. почему его лучше проводить не на исходных данных, а на первых главных компонентах/осях/размерностях. Кластерный позволит выявить людей со сходными стратегиями. Только мне совсем не нравится что вы ждёте ( ... )

Reply

melon_di June 27 2013, 12:02:57 UTC
Спасибо большое! буду пробовать=)

Reply


Leave a comment

Up