May 23, 2011 12:02
Выдвигаю на обсуждение отнюдь не досужую и не новую проблему двоичных переменных, т.е. проблему шкалы "нету" vs "есть" - ее обычно кодируют как 0 vs 1. Пожалуйста, выскажитесь (аргументированно) по каким-л. из следующих вопросов:
1) Корректно ли вычислять среднюю и дисперсию для такой переменной?
2) Корректно ли делать с такими переменными кластеризацию респондентов методом Уорда (на базе квадратных евклидовых расстояний, разумеется)?
3) Корректно ли делать на таких переменных анализ главных компонент, факторный анализ (классические, линейные версии этих анализов)?
Шкалы измерения,
Факторный анализ,
Статистики изменчивости (дисперсия...),
Переменные: мерные (интервальн./отнош.),
Переменные: двоичные (бинарные),
Статистики центра (среднее/медиана...),
Кластерный анализ