Comments | ircat: Ох нелегкая это работа :-)

ircat

Ох нелегкая это работа :-)

Dec 01, 2009 17:26

Сегодня исполнилось полтора года, как я работаю на своей теперешней работе. Могу похвастаться, что ничего не изменилось, и я обожаю свою работу также, как и прежде ( Read more... )

трудовые будни

Comments 23

gravizapp December 3 2009, 05:11:21 UTC

классно и интересно!
насколько у вас разнообразные модели, много их?
это больше статистический фиттинг или временны'е модели?
если не секрет конечно :)

ircat December 3 2009, 22:11:52 UTC

Моделей не так много, в первую очередь потому, что мне пришлось быть мастером на все руки и мне накидали много заданий в других областях. Построение моделей - это все-таки оптимизация, роскошь; сейчас взяли нового человека, отвечающего за веб-аналитику, так что у меня появится больше времени.
В основном мы используем clustering - автоматическое разделение игроков на группы (кластеры) - так что игроки в каждом кластере похожи друг на друга, и максимально отличаются от игроков в других кластерах. И classification и prediction - предсказания по ряду атрибутов значения другого атрибута - например, количество потраченных денег, активность, и т.д.
Я не знаю точно, что такое статистический фиттинг, но самая большая разница между статистикой и data mining такая - статистика предполагает, что некая теория (модель), описывающая данные - уже существует, и ее надо проверить. Data mining не требует никаких начальных предположений, все знания берутся из самих данных

grbizl December 3 2009, 13:10:05 UTC

А на чем делается 3? Я все жаждал прочитать какиенть знакомые слова, но так и не нашел :-(

ircat December 3 2009, 22:20:40 UTC

А какие знакомые слова ты искал, ну SQL хотя бы ты знаешь? :P
Мы используем IBM Intelligent Mining, у нас data warehouse работает на DB2, и это часть пакета. Это позволяет брать данные из DW, задавать алгоритм, и хранить модель в той же базе данных, так что она может в дальнейшем анализировать новые данные.
Еще я иногда использую SPSS - это статистический пакет, его правда недавно купила та же IBM и переименовала в PASW (нарочно не придумаешь) :-)
А методы, которые используются (может хоть эти слова тебе покажутся знакомыми? :-)) - decision trees, нейронные сети, logistic regression, k-means для clustering, и т.д. и т.п.

karl_ukral April 13 2011, 21:23:15 UTC

Пожалуй, я сошел бы с ума от такой работы )

ircat April 13 2011, 22:27:21 UTC

Ну что ж, хорошо, что вы - не я, а я - не вы :-)
А почему бы вы сошли с ума? И чем вы сами занимаетесь?

karl_ukral April 13 2011, 22:40:27 UTC

не дружу с цифрами ) У меня постоянно с ними конфликты и недопонимание ) Работаю в фирме занимающейся реализацией нефтепродуктов (точнее спекуляцией :) ) Раньше был дизайнером )

karl_ukral April 14 2011, 21:28:09 UTC

Можно вашу профессию назвать "цифропыт" :) (от следопыт)

Thread 6