Отбор признаков

Jul 22, 2013 16:27

Отбор признаков

Решение задачи выбора признаков для классификации в широко
известных методах (см. напр. [3,4]) основывается на сравнении
признаков между собой и отборе наиболее информативных
признаков по их численным характеристикам на обучающем
множестве. Однако мы обнаружили, что при классификация Веба
такие методы недостаточно учитывают присущий этой задаче шум.
Случайные слова, частотные на одном сайте (слово с ошибкой, ник
пользователя, многократное (тысячи раз) цитирование одной и той
же случайной фразы, нередко по общеизвестным критериям отбора
признаков оказываются значимыми для рубрик, к которым
относятся эти сайты.


http://romip.ru/romip2010/06_kc_class.pdf

yandex, 2010, ktfr

Previous post Next post
Up