Коллеги,
я решил приобщиться к культуре и попробовать parallel analysis для выбора числа факторов, вместо стандартных критериев Кайзера, Джоллифе и прочих каменных осыпей. И, честно говоря, пожалел, т.к. это привнесло больше путаницы, чем пользы.
Поэтому у меня есть ряд вопросов, которые не удалось прояснить из статьи автора скриптов для SPSS (
https://people.ok.ubc.ca/brioconn/nfactors/nfactors.html).
1) Как лучше обрабатывать пропущенные значения?
Дело в том, что у меня всего 81 наблюдение на 3 блока вопросов (35, 67 и 51 соответствено). Выбрасывать наблюдения listwise во время факторного анализа -- непозволительная роскошь, т.к. для соответствующих блоков остается всего по 26, 24 и 44 наблюдения и SPSS даже не отображает таблицу с результатами теста KMO и Bartlett. При этом /missing=omit в скрипте для MAP-теста предлагает 25/22/41 фактор, а raw_parallel -- 2/2/3. Хотя автор рекомендует использовать оба, т.к. она обычно более-менее сходятся в показаниях. В то же время /missing=accept даёт 3-6/64(sic!)/6-10 с точки зрения разных версий MAP, 4/9/3 по мнению raw_parallel и 7/7/9 по мнению простого parallel.
2) Правилно ли я понимаю, что работа с пропущенными значениями при parallel analysis и факторном анализе должна быть идентичной: т.е. число факторов, предложенных MAP/Parallel при удалении пропусков должно быть задано в процедуру ФА также с опцией удаления пропусков? Если да, то непонятно, как поступать в ситуации, когда факторный проводится с заменой пропусков средними.
3) Концептуальый вопрос: подходят ли эти тесты вообще для 10-балльной шкалы Ликерта и если да, то какой из вариантов parallel стоит предпочесть? Лично мне ближе и понятнее по смыслу raw_parallel, но по факту parallel выдаёт более желаемое число факторов. Я на радостях по всякому насчитал эти факторы, а потом увидел
вот эту заметку и как-то погрустнел. Связываться в polychoric correlation мне сейчас хочется меньше всего.
Заранее благодарю и извиняюсь за кросс-пост.