Comments | ru_spss: кластерный анализ ответов с множественным выбором

sterter95 in ru_spss

кластерный анализ ответов с множественным выбором

Apr 29, 2009 01:50

здравствуйте. Есть ли какие-то алгоритмы кластеризации, предназначенные специально для работы с ответами с множественным выбором (multiple response)? Интересует скорей даже не реализация в спсс, а сама суть таких алгоритмов. Объясните на пальцах или дайте ссылки на литературу, пожалуйста

Переменные: двоичные (бинарные), Многомерное шкалирование, Ответ множественный (Multiple Response), Программирование в SPSS: macros, Кластерный анализ

Leave a comment

Back to all threads

alexwin1961 April 29 2009, 07:02:53 UTC

поскольку чаще всего компонентами переменной множественного выбора являются дихотомические переменные, то при кластеризации используются меры расстояния для бинарных (binary) признаков (включая евклидово, поскольку дихотомическая переменная может считаться метрической). Иногда дихотомии даже стандартизируют

sterter95 April 29 2009, 21:16:42 UTC

благодарю Вас за ответ. Я так и думал, что все сводится к этому варианту.

Но бывает, что вопросов с множественным выбором, по которым идет кластеризация, несколько. Тогда по смыслу получается, что все переменные объединяются в группы (один вопрос - одна группа переменных). Для алгоритма кластеризации все переменные равнозначны, но по смыслу самих данных эти группы все-таки существуют. Как учеть такую разбивку при кластеризации?

alexwin1961 April 30 2009, 17:44:26 UTC

Вычислить несколько матриц близости на разных блоках и принять решение о том, как слить в единую матрицу. Иои испольовать многомерное шкалирование INDSCAL

sterter95 April 30 2009, 20:12:18 UTC

спасибо Вам, буду думать на эту тему. Идея с многомерным шкалированием интересна. Когда пойму, что же мне нужно, еще задам вопросы

gorgonops April 30 2009, 18:31:05 UTC

Насчет INDSCAL - интересная и здравая мысль, если позволите вставить слово. (Несмотря на то что многомерное шкалирование - все-таки не кластеризация. МШ несколько уходит от задачи группирования в сторону приоретизации задачи "найти общие измерения".)

Что касается вопроса "слить в единую матрицу", мог бы вам рекомендовать в помощь готовый макрос !CMPRMX (см. Matrix comparisons, rivita.ru/spssmacros.shtml), который скажет вам, насколько похожи те или другие из ваших ваши наборов множественного ответа в отношении кластерной, касательно респондентов, структуры.

gorgonops April 30 2009, 19:50:50 UTC

Если я неясно выразился насчет МШ, поясню: МШ, координируя в измерениях, традиционно делает упор на далекие (непохожие) друг от друга объекты, в то время как кластерный анализ - на близкие. Классическое МШ может пожертвовать точностью отображения взаимоположения близких объектов в интересах точности взаимоположения далеких объектов (задачи кластерного анализа прямо противоположные). Впрочем, многое тут зависит от формулы "стресса" в МШ.

sterter95 April 30 2009, 20:16:07 UTC

благодарю за пояснение. Как-то раньше мне не приходило в голову сравнивать такие разные (по цели и по алгоритмам) вещи, как МШ и кластерный анализ. Теперь придется подумать над этим

sterter95 April 30 2009, 20:13:31 UTC

Спасибо Вам за ответ. Концептуальную разницу между кластеризацией и МШ я понимаю, конечно же

sterter95 April 30 2009, 20:14:36 UTC

и спасибо за макрос

Back to all threads