кластерный анализ ответов с множественным выбором

Apr 29, 2009 01:50

здравствуйте. Есть ли какие-то алгоритмы кластеризации, предназначенные специально для работы с ответами с множественным выбором (multiple response)? Интересует скорей даже не реализация в спсс, а сама суть таких алгоритмов. Объясните на пальцах или дайте ссылки на литературу, пожалуйста

Переменные: двоичные (бинарные), Многомерное шкалирование, Ответ множественный (Multiple Response), Программирование в SPSS: macros, Кластерный анализ

Leave a comment

alexwin1961 April 29 2009, 07:02:53 UTC
поскольку чаще всего компонентами переменной множественного выбора являются дихотомические переменные, то при кластеризации используются меры расстояния для бинарных (binary) признаков (включая евклидово, поскольку дихотомическая переменная может считаться метрической). Иногда дихотомии даже стандартизируют

Reply

sterter95 April 29 2009, 21:16:42 UTC
благодарю Вас за ответ. Я так и думал, что все сводится к этому варианту.

Но бывает, что вопросов с множественным выбором, по которым идет кластеризация, несколько. Тогда по смыслу получается, что все переменные объединяются в группы (один вопрос - одна группа переменных). Для алгоритма кластеризации все переменные равнозначны, но по смыслу самих данных эти группы все-таки существуют. Как учеть такую разбивку при кластеризации?

Reply

alexwin1961 April 30 2009, 17:44:26 UTC
Вычислить несколько матриц близости на разных блоках и принять решение о том, как слить в единую матрицу. Иои испольовать многомерное шкалирование INDSCAL

Reply

sterter95 April 30 2009, 20:12:18 UTC
спасибо Вам, буду думать на эту тему. Идея с многомерным шкалированием интересна. Когда пойму, что же мне нужно, еще задам вопросы

Reply

gorgonops April 30 2009, 18:31:05 UTC
Насчет INDSCAL - интересная и здравая мысль, если позволите вставить слово. (Несмотря на то что многомерное шкалирование - все-таки не кластеризация. МШ несколько уходит от задачи группирования в сторону приоретизации задачи "найти общие измерения".)

Что касается вопроса "слить в единую матрицу", мог бы вам рекомендовать в помощь готовый макрос !CMPRMX (см. Matrix comparisons, rivita.ru/spssmacros.shtml), который скажет вам, насколько похожи те или другие из ваших ваши наборов множественного ответа в отношении кластерной, касательно респондентов, структуры.

Reply

gorgonops April 30 2009, 19:50:50 UTC
Если я неясно выразился насчет МШ, поясню: МШ, координируя в измерениях, традиционно делает упор на далекие (непохожие) друг от друга объекты, в то время как кластерный анализ - на близкие. Классическое МШ может пожертвовать точностью отображения взаимоположения близких объектов в интересах точности взаимоположения далеких объектов (задачи кластерного анализа прямо противоположные). Впрочем, многое тут зависит от формулы "стресса" в МШ.

Reply

sterter95 April 30 2009, 20:16:07 UTC
благодарю за пояснение. Как-то раньше мне не приходило в голову сравнивать такие разные (по цели и по алгоритмам) вещи, как МШ и кластерный анализ. Теперь придется подумать над этим

Reply

sterter95 April 30 2009, 20:13:31 UTC
Спасибо Вам за ответ. Концептуальную разницу между кластеризацией и МШ я понимаю, конечно же

Reply

sterter95 April 30 2009, 20:14:36 UTC
и спасибо за макрос

Reply


Leave a comment

Up