неожиданный аналог факторного балла

Dec 10, 2016 22:17

интересная вышла штука, пока не могу осмыслить всех ее следствий. Попробовал составить перечень конкретных иследовательских вопросов, которые можно поставить при использовании многоуровневой регрессии. Самый простой, не предполагающий специальной схемы сбора данных: человек отвечает на ряд вопросов, относящихся к одному фактору. Для каждого вопроса ( Read more... )

методология, размышлизм

Leave a comment

Comments 12

gorgonops December 13 2016, 09:31:08 UTC
Интригует. Но можно попросить подробностей, т.к. я пока ничего не ухватил?

Как выглядит регрессионное уравнение и что является в нем наблюдением "выборки" (респондент или пункт/вопрос)? Если имелся факторный балл, то значит был ФА, тогда его нагоузки - это те насыщенности, или насыщенности устанавливались независимо? Что было "придуманной мерой", что за модели проэкспериментированные, и в чем именно откровение или "чертовщина"? Словом - чуть яснее и не спеша, если вы захотите.

Reply

alexwin1961 December 13 2016, 10:29:30 UTC
вот пример на R:

library(psych)
library(GPArotation)

## берем данные по большой пятерке из пакета псих
data(bfi)
b5 <- na.omit(bfi[1:25])

## факторизуем методом минимальных остатков, выделяя 5 факторов, вращение облимин, факторные баллы оцениваем регрессионным методом
m <- fa(b5, 5, scores = "regression")

## берем нагрузки второго фактора как меру насыщенности вопросов
factor <- 2
p <- m$loadings[,factor]

## для каждого испытуемого строится модель линейной регрессии ответа на вопрос в зависимости от насыщенности вопроса фактором. Возвращается наклон регрессионной линии
slopes <- apply(b5, 1, function(e) lm(e ~ p)$coefficients[2])
## смотрим корреляцию факторного балла и наклона по испытуемым
cor(m$scores, slopes)

## результат:
[,1]
MR2 -0.3364667
MR3 0.9929752
MR5 0.2566126
MR1 -0.3591537
MR4 0.2693175

удивляет величина корреляции

Reply

gorgonops December 13 2016, 11:11:58 UTC
Я не могу понять предпоследний абзац. "для каждого испытуемого строится модель... ответа... в зависимости от насыщенности вопроса" я понимаю так. Для каждого респондента i, отдельно, делается регрессия вида X=bA+e, где X - ответ респондента, A - нагрузка ф-ра II на вопрос; и вопросы 1,2,...,p вопросов теста составляют кейсы (точки, наблюдения) этого регрессионного анализа i. Я правильно вас понял?

Reply

alexwin1961 December 13 2016, 11:56:20 UTC
да, правильно

Reply


Leave a comment

Up