тщательнЕе бы

Jul 03, 2015 09:05

никогда бы не подумал, что с анализом главных компонент творится такой бардак. Вроде бы классика, а вот поди ж ты. В R есть как минимум три процедуры для PCA: prcomp, princomp и principal из пакета psych. Первые две не печатают собственные значения матрицы, а корни из них. Естественно, заинтересовался, что будет, если матрица сингулярна (т.е., некоторые собственные значения отрицательны). А ничего не будет, они по-тихому устанавливаются в ноль. Значения главных компонент вычисляются умножением центрированной матрицы данных на перешкалированные собственные вектора. В результате дисперсии главных компонент не равны собственным числам матрицы, как утверждает учебник. В самом учебнике в формуле, по которой вычисляются значения главных компонент, используется центрированная, а не стандартизированная матрица данных, вдобавок перепутаны местами перемножаемые матрицы, что приводит к ошибке "неподобные аргументы". В процедуре principal все нормально с собственными значениями, но главные компоненты вычисляются как в факторном анализе - регрессионным методом (точно так же, как это делает и SPSS). В итоге главные компоненты не имеют единичной корреляции с теми, которые вычисляются по учебнику. Я в охренении

методы

Previous post Next post
Up