Сегодня исполнилось полтора года, как я работаю на своей теперешней работе. Могу похвастаться, что ничего не изменилось, и я обожаю свою работу также, как и прежде
( Read more... )
классно и интересно! насколько у вас разнообразные модели, много их? это больше статистический фиттинг или временны'е модели? если не секрет конечно :)
Моделей не так много, в первую очередь потому, что мне пришлось быть мастером на все руки и мне накидали много заданий в других областях. Построение моделей - это все-таки оптимизация, роскошь; сейчас взяли нового человека, отвечающего за веб-аналитику, так что у меня появится больше времени. В основном мы используем clustering - автоматическое разделение игроков на группы (кластеры) - так что игроки в каждом кластере похожи друг на друга, и максимально отличаются от игроков в других кластерах. И classification и prediction - предсказания по ряду атрибутов значения другого атрибута - например, количество потраченных денег, активность, и т.д. Я не знаю точно, что такое статистический фиттинг, но самая большая разница между статистикой и data mining такая - статистика предполагает, что некая теория (модель), описывающая данные - уже существует, и ее надо проверить. Data mining не требует никаких начальных предположений, все знания берутся из самих данных
А какие знакомые слова ты искал, ну SQL хотя бы ты знаешь? :P Мы используем IBM Intelligent Mining, у нас data warehouse работает на DB2, и это часть пакета. Это позволяет брать данные из DW, задавать алгоритм, и хранить модель в той же базе данных, так что она может в дальнейшем анализировать новые данные. Еще я иногда использую SPSS - это статистический пакет, его правда недавно купила та же IBM и переименовала в PASW (нарочно не придумаешь) :-) А методы, которые используются (может хоть эти слова тебе покажутся знакомыми? :-)) - decision trees, нейронные сети, logistic regression, k-means для clustering, и т.д. и т.п.
не дружу с цифрами ) У меня постоянно с ними конфликты и недопонимание ) Работаю в фирме занимающейся реализацией нефтепродуктов (точнее спекуляцией :) ) Раньше был дизайнером )
Comments 23
насколько у вас разнообразные модели, много их?
это больше статистический фиттинг или временны'е модели?
если не секрет конечно :)
Reply
В основном мы используем clustering - автоматическое разделение игроков на группы (кластеры) - так что игроки в каждом кластере похожи друг на друга, и максимально отличаются от игроков в других кластерах. И classification и prediction - предсказания по ряду атрибутов значения другого атрибута - например, количество потраченных денег, активность, и т.д.
Я не знаю точно, что такое статистический фиттинг, но самая большая разница между статистикой и data mining такая - статистика предполагает, что некая теория (модель), описывающая данные - уже существует, и ее надо проверить. Data mining не требует никаких начальных предположений, все знания берутся из самих данных
Reply
Reply
Мы используем IBM Intelligent Mining, у нас data warehouse работает на DB2, и это часть пакета. Это позволяет брать данные из DW, задавать алгоритм, и хранить модель в той же базе данных, так что она может в дальнейшем анализировать новые данные.
Еще я иногда использую SPSS - это статистический пакет, его правда недавно купила та же IBM и переименовала в PASW (нарочно не придумаешь) :-)
А методы, которые используются (может хоть эти слова тебе покажутся знакомыми? :-)) - decision trees, нейронные сети, logistic regression, k-means для clustering, и т.д. и т.п.
Reply
Reply
А почему бы вы сошли с ума? И чем вы сами занимаетесь?
Reply
Reply
Reply
Leave a comment