Захожу на главную страничку Яндекса, чтобы проверить, не пришло ли на почту новое письмо, и невольно обращаю внимание на сводку последних новостей. "Два торнадо пронеслись над Нью-Йорком, жертв и пострадавших нет" - интересно, перехожу по ссылке.
Пробежался глазами по анонсам новостей, решил посмотреть видеосюжет. Глядишь, что-нибудь интересное засняли... Кликаю по первому изображению (по тому, под которым после наведения появилась подпись "По Нью-Йорку пронесся торнадо"), жду загрузки сайта НТВ и удивляюсь увиденному:
Какой-то Исаак, видите ли, проверяет на прочность дамбу на реке Миссисипи. "Наверное, как всегда придумали глупый заголовок" - подумал я и кликнул на заблокированный элемент Flash.
Оказывается, "Исаак" - это тропический шторм, а сама новость абсолютно ничего общего с торнадо в Нью-Йорке не имеет. Кроме того, в правом меню даже есть ссылка с релевантным новости текстом. Как алгоритмам Яндекса взбрело в голову процессор причислить это совершенно бесполезное видео про реку Миссисипи к Нью-Йорку, я ума не приложу.
Я никогда не понимал, какой смысл имеют фразы типа "Яндекс такой яндекс...", но сейчас, глядя на алгоритм определения релевантности материалов конкретной новости, эта фраза, полагаю, придётся в самый раз. Впрочем, не удивительно, что система не может определить релевантные новостные материалы, если даже при ранжировании обычных материалов в результатах поиска встречается много мусора.