Рекомендации по Байесу

Oct 19, 2008 12:39

Теорема Байеса очень успешно используется для фильтрации спама. Вкратце, она позволяет "обратить" вероятность: при обучении фильтра мы знаем вероятность появления того или иного слова в спаме и в обычной почте, а потом на основе слов оцениваем вероятность того, спам это или нет ( Read more... )

it, recommend

Leave a comment

sam_in_lj October 19 2008, 14:59:53 UTC
Тема интересная, ага. Такое ощущение, что где-то встречал то ли насчёт фильмо, то ли музыки...

По фильмам конечно сложнее, зависит от того, как хорошо ставятся тэги и т.п. Либо брать обзоры. И то, не понятно, как обрабатывать именно содержание фильма, а не личные впечатления от него.
Пока что у меня лучше срабатывает нахождение людей, чей вкус больше всего совпадает с твоим, и брать фильмы из их списка.
О, или брать комбинацию (фильм, автор списка) :) Наверное, должно сработать...

Вот по содержанию книг - это интересно. Правда, там тоже, наверное нужно разделять тематику: например, если брать и художественную литературу, и техническую, то в результате в выборке может имхо появиться художественная литература с тяжёлым языком :), я же в художественной литературе чаще всего предпочитаю поменьше наукообразных слов, а в технической же наеборот, когда много воды - не приемлю.
Либо, когда проставляешь "вес", то выбирать сразу и вес для каждой категории (особенно для книг со смешанных категорий)..

Мысль интересная однако..

З.Ы. По поводу книг - на сайте livelib.ru есть какой-то алгоритм рекомендаций, но он не по содержанию, а, похоже, по тэгам.

Reply

alex14san October 19 2008, 16:57:29 UTC
люди с похожим вкусом - ага, но. во-первых, это не позволяет откопать очень-очень редкие фильмы, которые никто не знает, всякий там арт-хаус. во-вторых, оценить свежак, то что вот только что вышло, а никто ещё не успел посмотреть-оценить.

Reply


Leave a comment

Up