SVR с нечёткими значениями функции

Nov 19, 2013 16:38

Дорогие коллеги, посоветуйте, пожалуйста, как можно применить метод SVR (Support Vector Regression - модификация SVM для регрессий, а не классификаций) при наличии большого количества исходных данных с нечёткими значениями положительно-определённой функции ( Read more... )

Leave a comment

sasha_2 November 20 2013, 06:59:15 UTC
Большое спасибо за быстрый и содержательный ответ. Я изменил исходный пост, чтобы он был более понятен. По поводу Ваших замечаний и вопросов:
1. А неравенство всегда >?
- Да, всегда одного знака (или > , или < )
2. ...регрессия, ИМХО, и будет определять нижнюю границу
- Да, конечно, поэтому применять регрессию в лоб и нецелесообразно
3. Для того, чтобы предсказать значения точнее, опять-таки, ИМХО, но надо иметь какую-ту информацию относительно того насколько далеко f(x) отстоит от оценки снизу.
- К сожалению, такой информации нет и она в принципе недоступна (см. конкретный пример о времени жизни устройства)
4. Несложно придумать набор данных, для которых данная задача не будет решаема, без подобного знания.
- Это верно, контр-пример придумать можно, но я говорю о реальной ситуации - например, моменты замеров времени для "ещё живых", (т.е. не отказавших устройств) распределенны по нормальному закону с неизвестными, конечно, значениями параметров.
5. Ну, например, если функция x^2, а тренировочные данные получаются из функции x,
- Не совсем так, скорее min(x^2, randn), где randn распределенна по нормальному закону с неизвестными, конечно, значениями параметров.
6. Не будет никакого адекватного способа понять, что настоящая функция - это x^2.
- Это верно, но это может быть лучше, чем просто строить регрессию по, например, всего лишь 5-и точкам -:)
7. Одна на 5% данных, которые дают точное значение, а вторая на 95%, которые дают нижние границы.
- Просто "в лоб" использовать нижние границы мне кажется нецелесобразно, получим огромное занижение. Хотелось бы придумать более элегантное решение - что-то типа MLE для вычисления распределения времени жизни.

Reply

(The comment has been removed)

sasha_2 November 21 2013, 09:35:46 UTC
Насчёт ссылок - да, если не затруднит, спросите - несколько наиболее важных (а то гугль выдаст сразу мильён -:)
Насчёт порог/sqrt(2) - это интересно, но мне кажется этот поправочный коэффициент должен быть не абсолютным, а зависеть от... (?) . Буду думать. ещё раз спасибо за советы!

Reply

(The comment has been removed)

sasha_2 November 24 2013, 09:34:47 UTC
Спасибо за ответ. Насчёт PHM (Proportional Hazards Model) - этот метод я знаю, по сути это расширение того, что я привёл в посте в качестве примера и он тоже определяет параметры распределения, а не конкретные значения регрессии, как SVR.
Насчёт "sqrt(2) - это маразм, который непонятно откуда произошел" - в принципе согласен, но если делать более гибко - не порог, а какое-то индивидуальное начальное приближение (или то, что указано в неравенстве, или результат регрессии, полученной на полных данных, или и то, и то...) и умножать на некий общий поправочный коэффициент (полученный на основе кросс-валидации) - то, по-моему, может быть и неплохо. Проверю.

Reply

(The comment has been removed)

sasha_2 November 25 2013, 09:13:25 UTC
Спасибол, постараюсь достать эту книгу.

Reply


Leave a comment

Up