здравствуйте. Есть ли какие-то алгоритмы кластеризации, предназначенные специально для работы с ответами с множественным выбором (multiple response)? Интересует скорей даже не реализация в спсс, а сама суть таких алгоритмов. Объясните на пальцах или дайте ссылки на литературу, пожалуйста
поскольку чаще всего компонентами переменной множественного выбора являются дихотомические переменные, то при кластеризации используются меры расстояния для бинарных (binary) признаков (включая евклидово, поскольку дихотомическая переменная может считаться метрической). Иногда дихотомии даже стандартизируют
благодарю Вас за ответ. Я так и думал, что все сводится к этому варианту.
Но бывает, что вопросов с множественным выбором, по которым идет кластеризация, несколько. Тогда по смыслу получается, что все переменные объединяются в группы (один вопрос - одна группа переменных). Для алгоритма кластеризации все переменные равнозначны, но по смыслу самих данных эти группы все-таки существуют. Как учеть такую разбивку при кластеризации?
Вычислить несколько матриц близости на разных блоках и принять решение о том, как слить в единую матрицу. Иои испольовать многомерное шкалирование INDSCAL
Comments 9
Reply
Но бывает, что вопросов с множественным выбором, по которым идет кластеризация, несколько. Тогда по смыслу получается, что все переменные объединяются в группы (один вопрос - одна группа переменных). Для алгоритма кластеризации все переменные равнозначны, но по смыслу самих данных эти группы все-таки существуют. Как учеть такую разбивку при кластеризации?
Reply
Reply
Reply
Leave a comment