На РОМИП-2009 Яндекс рассказал про метрику pfound, предназначенную для оценки качества поиска. По словам Павла Карповича, эта метрика "хорошо себя зарекомендовала". Насколько я понял из ответов Павла, в Яндексе считают, что pfound лучше стандартных метрик РОМИП прогнозирует удовлетворенность живого пользователя результатами поиска.
Что же из себя
(
Read more... )
Comments 13
1. Зачем завязываться на размер выдачи? Многие поисковые машины разрешают запрашивать и 50 и 100 документов. Некоторые (бесконечная выдача поиска по картинкам bing, вторая страница Я.Картинок со скроллером) вообще имеют безстраничную выдачу. Мне кажется, наличие "страниц выдачи" - упячка (обусловленная технической реализацией) и лучше избавится от страничной выдачи, чем тянуть ее наличие в метрики.
2. Так же не очень хорошо делать метрику более "разрывной" за счет наличия поправки на страницы, ибо нам потом эту метрику оптимизировать. А более гладкие функции попроще оптимизировать )
Я, конечно, не очень в теме, но вот такие у меня соображения =)
Reply
(0.85)^21 = 0.033. Похоже, результаты на 2-й странице слабо влияют и при наличии разрыва и без =)
Reply
Возможно, это было бы и лучше. Но я не уверен, что основные веб-поисковики откажутся от страничной выдачи в ближайшем будущем.
> более гладкие функции попроще оптимизировать
Как и во всех подобных случаях, вопрос состоит лишь в том, чего здесь больше - выгоды от реализации фичи или же затрат на ее реализацию.
> У меня есть некоторые сомнения в том, что нужно "развивать" модель
У меня тоже есть сомнения) это были просто мысли вслух.
Reply
Я скорее про сложность работы процедуры численной оптимизации (устойчивость результатов, скорость сходимости, etc). Хотя тут мои знания более чем поверхностны и скорее философские =)
Reply
(The comment has been removed)
Таким образом, и мое, и ваше высказывание являются верными:
Если i-й документ помечен асессором как релевантный, то пользователь либо тоже сочтет его релевантным, либо не сочтет. Если пользователь согласится с оценкой асессора, то в модели pfound это обязательно приведет к остановке просмотра. Иначе просмотр продолжится. Таким образом, вероятность просмотра документа (i+1) действительно ниже, если i-й документ помечен асессором как релевантный.
Reply
Reply
Reply
1. картинки смотрят глубже, чем обычный вебпоиск,
2. бесконечные безстраничные выдачи а-ля бинг тоже доставляют.
- значит затухать вес позиции должен медлееееноооо (в сравнении с веб-делами)
совсем не затухать (p@n) тоже как-то странно. т.е. это p@5 метрика, если у нас выдача в 5 картинок (типа колдунщик), а для самой выдачи....
С одной стороны, раз смотрят глубоко, должно быть p@200, а с другой 200 - уже много, чтобы считать, все позиции одинаково полезны. т.к. пользователь не увидит все 200 картинок сразу.
Reply
Reply
Reply
Должен быть равен, но не может быть равен. Иначе топ1 получал бы 100% кликов от введенного запроса, а всем известно, что это не так, особенно по коммерческим запросам
Reply
Поэтому в такой модели вероятность просмотра первого документа равна 1. Или же 1-pBreak в зависимости от того, допускаем ли мы самоаннигиляцию пользователя до просмотра первого документа.
Reply
Reply
Leave a comment