Рейтинг онлайн-СМИ на основе дублирования новостей
дата: 15 мая, суббота, 17-00
докладчик: Александр Антонов (Галактика Зум, Москва)
- Рейтинг онлайн-СМИ в ситуации большого выбора источников может быть средством как явного вспомогательного инструмента - информации, предоставляемой для пользователя, так и неявного (применения полученных данных для ранжирования новостных сообщений при показе новостей).
- Обзор существующих подходов к составлению публикуемых рейтингов новостных источников. Примеры: Newsknife.com, Webscan, Медиалогия, Hitwise.com, Comscore.com, Nielsen.com, Reddit.com, Digg.com.
- Алгоритм формирования рейтинга новостных источников для ресурса webground.su. Ранжирование источников основано на информации о группах найденных новостей-дубликатов и признаком времени публикации, приписанном новостям.
Каждое из выделенных подмножеств представляется в виде направленного графа, вершинами которого являются сообщения, а ребрами - отношения в упорядочении внутри подмножества. К построенным графам применен алгоритм PageRank, с помощью которого каждой из вершин-сообщений на графе присваивается соответствующий вес.
Адрес прежний: 10-я линия В.О., д.49, ауд. 308
Вход на семинар свободный, предварительной регистрации не требуется.
http://mathlingvo.ru/nlpseminar/archive/s_34