Bing-Sting

Feb 02, 2011 13:08

Напишу о вчерашнем скандале. Весьма скользкая тема, поэтому лишний раз напомню, что мой блог отражает мое личное мнение, вовсе не обязательно совпадающее с официальной позицией моего работодателя. Также заявляю, что все глупости - мои личные, а все умные мысли принадлежат коллегам ( Read more... )

search

Leave a comment

k_ermakov February 2 2011, 12:17:03 UTC
1) В Microsoft использовали и не А и не Б, а нечто среднее между ними

Почему? Разве способ Б не подходит под то, что в итоге проверил Google?

Reply

plakhov February 2 2011, 13:22:04 UTC
Не подходит. Эксперимент демонстрирует, что Microsoft смотрит, по какому запросу человек перешел на страницу, и иногда "дописывает" в индекс, что в данном документе есть слова из этого запроса, если раньше. Это позволяет, например, автоматически "тырить" у соседей синонимы, аббревиатуры, исправления опечаток. Пункт Б я специально старался сформулировать таким образом, чтобы это было невозможно.

Reply

k_ermakov February 2 2011, 13:40:02 UTC
Не могу сказать, что полностью понял вашу мысль.

Как я понимаю, способ А - это берём выдачу конкурента и из неё забираем что-то интересное себе - тыринг в чистом виде.
Способ Б - это берём последовательно все страницы, посещаемые пользователями, и смотрим, как они с ними работают. Например, определяем, что страницу достаточно часто находят по какому-то запросу. Для того, чтобы это выяснить, достаточно ведь записать некоторые параметры, связанные с данной конкретной страницей, и не брать в явном виде ничего у конкурента? Можно, конечно, это расценить как на косвенный тыринг, но в условиях презумпции невиновности MS как бы чист и просто использует пользовательский фактор.

Reply

plakhov February 2 2011, 13:56:56 UTC
Вопрос в том, чем считать слова запроса, по которому конкурент нашел страничку - "параметром, связанным с данной конкретной страницей", или фичей, которую мы "в явном виде взяли у конкурента". По некоторым запросам правильный ответ, скорее, первый, а по некоторым - второй, и иногда это бывает очень важно. Например, по запросу [харківські новини] Яндекс умеет находить страничку http://atn.kharkov.ua/, а другие поисковики - нет (потому что она на русском языке, про "харьковские новости", а жители Харькова, как правило, свободно говорят по-русски). Я делал эту фичу (осторожный и правильный русско-украинский поиск) пару месяцев, не меньше, и мне очень обидно было бы, если бы через три дня после её выкатывания все остальные поисковики "узнали", что на этой страничке есть "харківські новини", после чего все вложения в фичу с точки зрения моего работодателя обессмыслились бы.

Reply

k_ermakov February 2 2011, 14:00:06 UTC
Понял вас теперь. Спасибо за пояснения.

Reply

ext_60084 February 2 2011, 15:24:14 UTC
Жители Харькова, как правило, свободно говорят по-русски, но запросы почему-то вводят по украински.

Reply

Я делал эту фичу пару месяцев petsen February 2 2011, 15:54:49 UTC
пару месяцев?!

Reply

Re: Я делал эту фичу пару месяцев ext_60084 February 2 2011, 19:40:08 UTC
Удивительно быстро по меркам Яндекса, я тоже в восхищении.

Reply

Re: Я делал эту фичу пару месяцев plakhov February 3 2011, 06:52:09 UTC
ну вот зочем ви дополнительно травите? она и так имеет в виду, что я её делал гораздо дольше двух месяцев

Reply

Re: Я делал эту фичу пару месяцев plakhov February 3 2011, 06:54:30 UTC
Я сам не знаю, как тут правильно считать. Содержательную часть (понять, что где показывать) пару месяцев. А инфраструктуру всякую по переводу бабушек через дорогу еще невесть сколько времени, но она не только ведь для этой задачи.

Reply

g00dmann February 2 2011, 14:02:20 UTC
Ну так не очевидно же, что Бинг таким образом намеренно наращивает свой индекс. Скорее всего все немного не так и я думаю, что в Бинге реализовывали именно Б, просто недодумали про западло от коллег.

Reply


Leave a comment

Up