Используем фичи на кликах.

May 28, 2012 19:23

Когда мы пытались что-то родить для ИМАТ-2011, возник стандартный вопрос - как бы так набрать фичей, чтобы всех забороть? Тогда мы разобраться не успели и забили на это все. А сейчас с какого-то бодуна вспомнили, поковырялись в литературе и собрали большинство факторов в кучки: "Поведенческие (кликовые) факторы в информационном поиске. Обзор". ( Read more... )

Leave a comment

(The comment has been removed)

g00dmann May 28 2012, 17:43:03 UTC
1. Данные от систем статистики поисковиками используются, как свои, так и чужие. Я что-то сомневаюсь, что были официальные заявления о невлиянии таких данных на ранжирование. Корреляции нет, т.е. прямой зависимости наличия поисковой статистики на сайте и позиций. А влияние может быть, для одних сайтов положительное, для других - не очень, для третьих - никакое.

2. Не нужно подходить к наличию каких-то факторов и их силе с обычной логикой. Текущая позиция индустрии: если добавление фактора в модель улучшает качество поиска, значит это замечательный фактор. Заметьте - ни слова о логичности данного фактора нет, на это разработчикам зачастую плевать.

Reply

(The comment has been removed)

(The comment has been removed)

g00dmann June 20 2012, 21:36:00 UTC
Ну с Гуглом могут быть варианты:
- Кац врет (на вранье гуглоиды неоднократно ловились, например с гео-привязкой мак-адресов через вайфай).
- Кац лукавит, т.е. данные, выдаваемые вебмастеру в Аналитиксе не используются, ввиду их ненужности в ранжировании, но логи, собираемые для Аналитикса, используются и для ранжирования. :)
- Кац не врет и эти данные _уже_ не используются, т.к. хватает данных, собираемых Хромом и прочими ФФ.

Ну и еще какие-то варианты наверняка есть.

Reply


Leave a comment

Up