Leave a comment

(The comment has been removed)

antilamer January 16 2014, 06:20:15 UTC
> случайная функция потерь
Это значит, что она вычисляется экспериментально, и результат эксперимента может довольно сильно колебаться в зависимости от фазы луны. Так что надо что-нибудь из оперы robust stochastic optimization.

Но вообще, основной вопрос для меня стоит так: есть точка в пространстве A; как определить, с какими другими точками в этом пространстве она вообще сравнима для целей подбора оптимального P (у этого были бы и другие важные для меня применения, кроме собственно оптимизации P).

GRBT - я правильно понял, что их фишка в том, что они одновременно решают задачу и классификации/кластеризации, и регрессии/оптимизации внутри класса?

Reply

(The comment has been removed)

antilamer January 16 2014, 07:14:05 UTC
> Я не Коппенгаген в данном вопросе, но боюсь, что это тогда большая труба.
Так вот именно поэтому и хочется кластеризовать наблюдения, чтобы было, что усреднять, например.

Reply

ext_681947 January 16 2014, 16:40:02 UTC
GRBT в режиме регрессии и выдаст условно "усреднение" по параметру, так же как и обычная линейная регрессия "усредняет" шум, но в любом случаи это надо понимать в духе, у нас есть некоторая плотность и мы пытаемся построить некоторую ее апроксимацию-регрессию, то есть чисто теоретически отличие от линейной регрессии - "нелинейность" и робастность.

Reply

(The comment has been removed)

antilamer January 16 2014, 07:11:36 UTC
> А есть какие-то признаки того, что Евклидово расстояние будет неадекватно в данном случае для разных признаков?
Евклидово расстояние предполагает, что все признаки важны :) Тогда как на самом деле это точно не так.
Может, в первом приближении и можно определить глобально, какие важны, а какие неважны - но думаю, что на практике это тоже будет неправильно, т.к. какие-то признаки важны лишь иногда...

Вообще, конечно, надо набрать данных сначала, и поиграться с ними :)

Reply

(The comment has been removed)

kashnikov January 16 2014, 12:56:45 UTC
+1

Мне кажется, или еще можно посмотреть в сторону co-clustering/subclustering? Я не совсем уверен что правильно понял ограничения в исходной задаче. Перечитаю дома внимательней.

Reply


Leave a comment

Up