SVС для объектов с пустыми полями у некоторых параметров

May 22, 2017 08:33

Обычно под "missing data" понимают отсутствие меток у некоторых объектов - так называемый "semi-supervised classification". В моей же задаче классификации ситуация иная - метки есть по всем объектам из обучающей выборки, а вот у некоторых объектов по некоторым параметрам  отсутствуют данные . Подскажите, пожалуйста, как в этом случае применить SVM ( Read more... )

classification, svm

Leave a comment

Comments 2

(The comment has been removed)

sasha_2 May 23 2017, 10:40:35 UTC
Выкидывать не получится - практически по каждому атрибуту по каким-то объектам не будет данных, и аналогично по каждому объекту могут отсутствовать значения каких-то атрибутов. Стандартный приём data imputation - брать среднее по атрибуту. Но это не учитывает корреляции между объектами. А что если брать условное математическое ожидание атрибута (при отсутствии его значения для данного объекта)как для многомерного нормального закона? Как это, по-Вашему, приемлемое допущение (о многомерном нормальном распределении значений атрибутов) или нет? Заранее спасибо за ответ.

Reply

(The comment has been removed)

sasha_2 May 23 2017, 12:44:26 UTC
Спасибо, пошёл думать и пробовать!

Reply


Leave a comment

Up