Гм. Ну вот тебе простая практическая задача. Небольшой заказчик имеет интерес к прогнозированию собственного энергопотребления. Что позволит ему иметь некоторую экономию в расходах. Держать выделенного аналитика для данных целей не хочет. Заказную индивидуальную модель "под себя" также считает дорогой. Из экселя уже вырос. Поэтому согласен на использование готовых общерыночных прогнозов с уточнением собственными данными, которые являются его личной собственностью и делиться которыми он не готов. Т.е. часть входных данных заранее не известна и формируется заказчиком "на лету". Там могут оказаться как очень значимые для прогнозирования вещи, так и мусор. Тогда ему делается черный ящик на вход которого можно закинуть много предикторов и дается простой интерфейс в духе "щелкните по кнопке 2 если желаете рассчитать пессимистичный прогноз". А за этой кнопками может прятаться как готовый Random Forest, так и нелинейная модель работающая на понимании рынка и/или физики происходящих процессов. В любом случае эти модели должны уметь всякую совершенно неинтересную вам хуйню типа Factor prioritization, Factor fixing, Variance cutting, Factor mapping о чем и упомянуто в слайдах.
Reply
Leave a comment