Работа со сложным данными

May 24, 2009 09:12

Прошu совета. У меня накопилось столько вопросов, что кажется, пора задать один глобальный вопрос. Я работаю с данными, записанными в форме:

UserID TransactionDate   Sum
1             2005-03-04            25
1             2005-04-06            40
1             2005-08-16            10
2
2

Из них мне нужно создавать разные переменные, записанные в стандартном виде, когда на каждой строчке один UserID. Например:

1. Коэффициент регрессии для каждого человека : сумма от времени
2. Коэффициент регрессии для каждого человека : частота тразакций в неделю, месяц или день от времени
3. Число случаев выше 2 стандартных откланений для каждого человека.

Вероятно будет еще много подобного. Я так понимаю, что работая на SPSS можно писать на языке Python, и это даст бесконечные возможности для создания собственных функций (я вообще, программирую на Java и Php, так что с языками программирования знакома.) Имеет ли это смысл? Правильный ли это подход? Или надо пытаться решать каждую такую задачу отдельно? Есть ли какой-нибудь более или менее стандартный подход к таким файлам, и где о нем можно прочитать? 

Данные сложные (вложенные/3-входовые..), Смешанная линейная модель (MLM), Программы: разные полезные, Данные: изменение структуры массива, Программы/статистические языки - не SPSS

Previous post Next post
Up