Дорогие коллеги, посоветуйте, пожалуйста, как можно применить метод SVR (Support Vector Regression - модификация SVM для регрессий, а не классификаций) при наличии большого количества исходных данных с нечёткими значениями положительно-определённой функции
(
Read more... )
1. А неравенство всегда >?
- Да, всегда одного знака (или > , или < )
2. ...регрессия, ИМХО, и будет определять нижнюю границу
- Да, конечно, поэтому применять регрессию в лоб и нецелесообразно
3. Для того, чтобы предсказать значения точнее, опять-таки, ИМХО, но надо иметь какую-ту информацию относительно того насколько далеко f(x) отстоит от оценки снизу.
- К сожалению, такой информации нет и она в принципе недоступна (см. конкретный пример о времени жизни устройства)
4. Несложно придумать набор данных, для которых данная задача не будет решаема, без подобного знания.
- Это верно, контр-пример придумать можно, но я говорю о реальной ситуации - например, моменты замеров времени для "ещё живых", (т.е. не отказавших устройств) распределенны по нормальному закону с неизвестными, конечно, значениями параметров.
5. Ну, например, если функция x^2, а тренировочные данные получаются из функции x,
- Не совсем так, скорее min(x^2, randn), где randn распределенна по нормальному закону с неизвестными, конечно, значениями параметров.
6. Не будет никакого адекватного способа понять, что настоящая функция - это x^2.
- Это верно, но это может быть лучше, чем просто строить регрессию по, например, всего лишь 5-и точкам -:)
7. Одна на 5% данных, которые дают точное значение, а вторая на 95%, которые дают нижние границы.
- Просто "в лоб" использовать нижние границы мне кажется нецелесобразно, получим огромное занижение. Хотелось бы придумать более элегантное решение - что-то типа MLE для вычисления распределения времени жизни.
Reply
(The comment has been removed)
Насчёт порог/sqrt(2) - это интересно, но мне кажется этот поправочный коэффициент должен быть не абсолютным, а зависеть от... (?) . Буду думать. ещё раз спасибо за советы!
Reply
(The comment has been removed)
Насчёт "sqrt(2) - это маразм, который непонятно откуда произошел" - в принципе согласен, но если делать более гибко - не порог, а какое-то индивидуальное начальное приближение (или то, что указано в неравенстве, или результат регрессии, полученной на полных данных, или и то, и то...) и умножать на некий общий поправочный коэффициент (полученный на основе кросс-валидации) - то, по-моему, может быть и неплохо. Проверю.
Reply
(The comment has been removed)
Reply
Leave a comment