NLP семинар, 15 мая

May 10, 2010 23:40

Рейтинг онлайн-СМИ на основе дублирования новостей

дата: 15 мая, суббота, 17-00
докладчик: Александр Антонов (Галактика Зум, Москва)

- Рейтинг онлайн-СМИ в ситуации большого выбора источников может быть средством как явного вспомогательного инструмента - информации, предоставляемой для пользователя, так и неявного (применения полученных данных для ранжирования новостных сообщений при показе новостей).

- Обзор существующих подходов к составлению публикуемых рейтингов новостных источников. Примеры: Newsknife.com, Webscan, Медиалогия, Hitwise.com, Comscore.com, Nielsen.com, Reddit.com, Digg.com.

- Алгоритм формирования рейтинга новостных источников для ресурса webground.su. Ранжирование источников основано на информации о группах найденных новостей-дубликатов и признаком времени публикации, приписанном новостям.

Каждое из выделенных подмножеств представляется в виде направленного графа, вершинами которого являются сообщения, а ребрами - отношения в упорядочении внутри подмножества. К построенным графам применен алгоритм PageRank, с помощью которого каждой из вершин-сообщений на графе присваивается соответствующий вес.

Адрес прежний: 10-я линия В.О., д.49, ауд. 308
Вход на семинар свободный, предварительной регистрации не требуется.

http://mathlingvo.ru/nlpseminar/archive/s_34
Previous post Next post
Up