Есть ли какое-то готовое средство для перевода сырых данных по выборке в нормализованную шкалу типа стенов? Сейчас я делаю это сперва через Frequencies высчитав соответствующие процентили, затем через Recode расставляя эти процентили для каждой шкалы. Задача редкая, но когда с ней сталкиваюсь - злюсь почему-то. Не знаете ли какого-нибудь скрипта
(
Read more... )
Comments 20
* Сгенерируем кривые данные, преобладают малые значения.
DATA LIST FREE /v1.
BEGIN DATA.
2 2 2 2 2 2 3 3 3 3 3 2 2 1 11 1 1 1 3 3 3 4
5 6 8 9 10 11 12 11 4 4 4 4 3 3 3 10 10 22 21
25 28 30 30 31 3 3 3 3.4 2.1 4.4 5.9 5 6 3.2
2.1 2.11 1.11 0.5 0.9 0.8 1 0.1 3.9 4.2 5.3 6.1
2.4 2.5 2.7 2.9 2.8
END DATA.
* Зададим желаемые параметры нормализованной шкалы (среднее 5.5 ,ст. откл. 2 (это я в Википедии прочитал :)).
comp m=5.5.
comp dev=2.
* Собственно, преобразование.
RANK
VARIABLES=v1 (A) /PROPORTION /FRACTION=BLOM .
COMPUTE T=IDF.NORMAL(pv1,0,1)*dev+m.
* Смотрим, что было и что получилось.
FREQ v1 T /HIST.
NPAR TESTS /K-S(NORMAL)= v1 T.
Reply
А соответствующие процентили - это 10, 20, 30 и т.д.?
Если да, то в 11 версии это делает Transform Categorize variables , далее сырые баллы в одно окно, 10 в другое
Reply
Reply
Сначала конвертируем переменную в нормалихованные баллы (это делается несколько проще и на основании иного метода вычисления пропорции, чем указал Антон). в примере переменная N переводится в ZN:
RANK VARIABLES = N(A)
/NORMAL INTO ZN
/PRINT=NO
/TIES=MEAN
/FRACTION=RANKIT .
потом нормализованные баллы перекодируются в стены:
recode ZN
(LO thru -2.0 = 1)
(LO thru -1.5 = 2)
(LO thru -1.0 = 3)
(LO thru -0.5 = 4)
(LO thru 0.0 = 5)
(LO thru 0.5 = 6)
(LO thru 1.0 = 7)
(LO thru 1.5 = 8)
(LO thru 2.0 = 9)
(LO thru HI = 10) into N.STAN.
Reply
(The comment has been removed)
RANK
VARIABLES = O1 O2 O3 (A) / NORMAL INTO ZO1 ZO2 ZO3
/TIES=MEAN /FRACTION=RANKIT.
Убедитесь, что переменные O1 O2 O3 действительно есть в файле данных (откройте его сначала), проверьте, чтобы новых переменных было указано такое же количество и они отсутствовали до выполнения команды.
Reply
Reply
Reply
Количество знаков после запятой - сколько зададите в описании переменной, столько и будет показывать, ну а значимость различий- разве критерии не решают проблемы, хотя Ваша последняя фраза (про инструмент) меня несколько смущает.
Короче - традиция и ,возможно, специфика.
Reply
Reply
Reply
Reply
Leave a comment