(Untitled)

Feb 04, 2009 10:48

Прогнозирование марочной прочности цемента. Есть тестовые данные и мат.модель(1). Есть метод опорных векторов(2) - svm из пакета e1071. Есть нечеткий аппроксиматор, оптимизированный генетикой(3). Есть qr-декомпозиция(4).
#. метод - суммарная ошибка
1. math - 43.3
2. svm - 20.6
3. fuzzyga - 1.5
4. qr - 21.8

r, diss, ga

Leave a comment

Comments 5

anonymous February 5 2009, 07:12:35 UTC
А сколько точек экспериментальных всего и сколько показателей каждую точку описывает?

И самый главный вопрос суммарная ошибка где? в выборке используемой для обучения, или в выделенной контрольной не участвовавшей в расчетах?

Вам нечеткий анализатор не завалил точки перегиба в каждой из экспериментальной? Уж очень подозрительно оценка выглядит.

PS А то знаете ли мне никогда не забыть способ вычисление одной знакомой лабораторией уровня сахара в крови по хх показателям электрокардиограммы :)))

PPS наиболее правильно построить бутстреп процедуру, она должна посчитать множество разбиений исходных данных на "обучающую" и контролирующую конечное качество модели. Статистика оного бутстрепа и скажет какой метод лучше и вообще есть ли модель.

Reply

basp February 5 2009, 11:08:25 UTC
Да, конечно - генетика переобучает аппроксиматор. А модель сильно условна(но других, похоже, и нет). Но дело даже не в этом - даже та ошибка, что есть - слишком велика и на практике все равно используют "съевших-собаку" экспертов и многочисленные эксперименты.
Это похоже на то, как я видел диагностическую систему рака груди - даже та небольшая ошибка, что она даёт - критична.

Reply

anonymous February 5 2009, 14:02:03 UTC
даже в случае генетики не все потеряно :) загрубите модель которую она подбирает. Если уменьшить кол-во параметров которые она подбирает или если строится сама модель --- пусть будет ограничена её сложность.

Критерий качества подбора модели: после обучения она должна давать хорошее предсказания на точке не участвовавшей в обучении.

Можно например "складным ножом" если выборка x, length(x)== n точек посчитать n моделей на n выборках в каждой из которых исключена по очереди одна точка. После этого сравнить предсказание конкретной модели с реальной точкой.

поскольку время счета модели много больше пользы векторизации напишем "на фортране" :)
rezult<-0
for (i in 1:length(x)) {model.o<-model(x[-i,с(независимые)]); rezult[i]<-predict(x[i,с(независимые)], model.o)}

Оценка ошибки метода plot(density(result-x[,зависимая].

Reply

basp February 5 2009, 19:07:29 UTC
> Критерий качества подбора модели: после обучения она должна давать хорошее предсказания на точке не участвовавшей в обучении.

Так и делаю. И при сокращении числа правил точность всех методов прилизительно одинакова - но аппроксиматор естественно расширяется экспертными эвристиками, что дает все же лучшую перспективу прогноза
спасибо, кстати, за проявляемый интерес

Reply


Leave a comment

Up