Когда мы пытались что-то родить для ИМАТ-2011, возник стандартный вопрос - как бы так набрать фичей, чтобы всех забороть? Тогда мы разобраться не успели и забили на это все. А сейчас с какого-то бодуна вспомнили, поковырялись в литературе и собрали большинство факторов в кучки: "
Поведенческие (кликовые) факторы в информационном поиске. Обзор".
(
Read more... )
(The comment has been removed)
2. Не нужно подходить к наличию каких-то факторов и их силе с обычной логикой. Текущая позиция индустрии: если добавление фактора в модель улучшает качество поиска, значит это замечательный фактор. Заметьте - ни слова о логичности данного фактора нет, на это разработчикам зачастую плевать.
Reply
(The comment has been removed)
(The comment has been removed)
- Кац врет (на вранье гуглоиды неоднократно ловились, например с гео-привязкой мак-адресов через вайфай).
- Кац лукавит, т.е. данные, выдаваемые вебмастеру в Аналитиксе не используются, ввиду их ненужности в ранжировании, но логи, собираемые для Аналитикса, используются и для ранжирования. :)
- Кац не врет и эти данные _уже_ не используются, т.к. хватает данных, собираемых Хромом и прочими ФФ.
Ну и еще какие-то варианты наверняка есть.
Reply
Leave a comment