> случайная функция потерь Это значит, что она вычисляется экспериментально, и результат эксперимента может довольно сильно колебаться в зависимости от фазы луны. Так что надо что-нибудь из оперы robust stochastic optimization.
Но вообще, основной вопрос для меня стоит так: есть точка в пространстве A; как определить, с какими другими точками в этом пространстве она вообще сравнима для целей подбора оптимального P (у этого были бы и другие важные для меня применения, кроме собственно оптимизации P).
GRBT - я правильно понял, что их фишка в том, что они одновременно решают задачу и классификации/кластеризации, и регрессии/оптимизации внутри класса?
> Я не Коппенгаген в данном вопросе, но боюсь, что это тогда большая труба. Так вот именно поэтому и хочется кластеризовать наблюдения, чтобы было, что усреднять, например.
GRBT в режиме регрессии и выдаст условно "усреднение" по параметру, так же как и обычная линейная регрессия "усредняет" шум, но в любом случаи это надо понимать в духе, у нас есть некоторая плотность и мы пытаемся построить некоторую ее апроксимацию-регрессию, то есть чисто теоретически отличие от линейной регрессии - "нелинейность" и робастность.
> А есть какие-то признаки того, что Евклидово расстояние будет неадекватно в данном случае для разных признаков? Евклидово расстояние предполагает, что все признаки важны :) Тогда как на самом деле это точно не так. Может, в первом приближении и можно определить глобально, какие важны, а какие неважны - но думаю, что на практике это тоже будет неправильно, т.к. какие-то признаки важны лишь иногда...
Вообще, конечно, надо набрать данных сначала, и поиграться с ними :)
Мне кажется, или еще можно посмотреть в сторону co-clustering/subclustering? Я не совсем уверен что правильно понял ограничения в исходной задаче. Перечитаю дома внимательней.
(The comment has been removed)
Это значит, что она вычисляется экспериментально, и результат эксперимента может довольно сильно колебаться в зависимости от фазы луны. Так что надо что-нибудь из оперы robust stochastic optimization.
Но вообще, основной вопрос для меня стоит так: есть точка в пространстве A; как определить, с какими другими точками в этом пространстве она вообще сравнима для целей подбора оптимального P (у этого были бы и другие важные для меня применения, кроме собственно оптимизации P).
GRBT - я правильно понял, что их фишка в том, что они одновременно решают задачу и классификации/кластеризации, и регрессии/оптимизации внутри класса?
Reply
(The comment has been removed)
Так вот именно поэтому и хочется кластеризовать наблюдения, чтобы было, что усреднять, например.
Reply
Reply
(The comment has been removed)
Евклидово расстояние предполагает, что все признаки важны :) Тогда как на самом деле это точно не так.
Может, в первом приближении и можно определить глобально, какие важны, а какие неважны - но думаю, что на практике это тоже будет неправильно, т.к. какие-то признаки важны лишь иногда...
Вообще, конечно, надо набрать данных сначала, и поиграться с ними :)
Reply
(The comment has been removed)
Мне кажется, или еще можно посмотреть в сторону co-clustering/subclustering? Я не совсем уверен что правильно понял ограничения в исходной задаче. Перечитаю дома внимательней.
Reply
Leave a comment