здравствуйте. Есть ли какие-то алгоритмы кластеризации, предназначенные специально для работы с ответами с множественным выбором (multiple response)? Интересует скорей даже не реализация в спсс, а сама суть таких алгоритмов. Объясните на пальцах или дайте ссылки на литературу, пожалуйста
поскольку чаще всего компонентами переменной множественного выбора являются дихотомические переменные, то при кластеризации используются меры расстояния для бинарных (binary) признаков (включая евклидово, поскольку дихотомическая переменная может считаться метрической). Иногда дихотомии даже стандартизируют
благодарю Вас за ответ. Я так и думал, что все сводится к этому варианту.
Но бывает, что вопросов с множественным выбором, по которым идет кластеризация, несколько. Тогда по смыслу получается, что все переменные объединяются в группы (один вопрос - одна группа переменных). Для алгоритма кластеризации все переменные равнозначны, но по смыслу самих данных эти группы все-таки существуют. Как учеть такую разбивку при кластеризации?
Вычислить несколько матриц близости на разных блоках и принять решение о том, как слить в единую матрицу. Иои испольовать многомерное шкалирование INDSCAL
Насчет INDSCAL - интересная и здравая мысль, если позволите вставить слово. (Несмотря на то что многомерное шкалирование - все-таки не кластеризация. МШ несколько уходит от задачи группирования в сторону приоретизации задачи "найти общие измерения".)
Что касается вопроса "слить в единую матрицу", мог бы вам рекомендовать в помощь готовый макрос !CMPRMX (см. Matrix comparisons, rivita.ru/spssmacros.shtml), который скажет вам, насколько похожи те или другие из ваших ваши наборов множественного ответа в отношении кластерной, касательно респондентов, структуры.
Если я неясно выразился насчет МШ, поясню: МШ, координируя в измерениях, традиционно делает упор на далекие (непохожие) друг от друга объекты, в то время как кластерный анализ - на близкие. Классическое МШ может пожертвовать точностью отображения взаимоположения близких объектов в интересах точности взаимоположения далеких объектов (задачи кластерного анализа прямо противоположные). Впрочем, многое тут зависит от формулы "стресса" в МШ.
благодарю за пояснение. Как-то раньше мне не приходило в голову сравнивать такие разные (по цели и по алгоритмам) вещи, как МШ и кластерный анализ. Теперь придется подумать над этим
Reply
Но бывает, что вопросов с множественным выбором, по которым идет кластеризация, несколько. Тогда по смыслу получается, что все переменные объединяются в группы (один вопрос - одна группа переменных). Для алгоритма кластеризации все переменные равнозначны, но по смыслу самих данных эти группы все-таки существуют. Как учеть такую разбивку при кластеризации?
Reply
Reply
Reply
Что касается вопроса "слить в единую матрицу", мог бы вам рекомендовать в помощь готовый макрос !CMPRMX (см. Matrix comparisons, rivita.ru/spssmacros.shtml), который скажет вам, насколько похожи те или другие из ваших ваши наборов множественного ответа в отношении кластерной, касательно респондентов, структуры.
Reply
Reply
Reply
Reply
Reply
Leave a comment