Про поисковые системы сравнительно-описательное.

Sep 26, 2005 20:15

А не интересует ли вас, товарищи, качество индексации и релевантность выдачи поисковых систем? Технический сравнительный анализ по абстрактным ключевым словам полезен и показателен, но иллюстрации лучше всего удаются на конкретных примерах.
Понадобилось мне всвязи с предыдущей записью найти известный текст выступления т.Сталина от 3 июля 1941г.. - набираю в Rambler, Yandex и Google "захват нашего хлеба" (в кавычках, но желающие могут подивиться этому же запросу без кавычек - особенно у Яндекса...) - и что же я вижу? То же, что и вы, щёлкнув на нижеприведённые ссылки:
- найдено сайтов: 70, документов: 192 (Rambler)
- результат поиска: страниц - 165, сайтов - не менее 10 (Yandex показал 10 ссылок и предложил, как всегда, ещё и купить слова :))
- примерно 149 (Google)

Но вы на выдачу посмотрите - ну, Яндекса, разумеется...! И сравните с выдачей Рамблера... .

А теперь пройдусь-ка я простыми тех. запросами и посмотрю как эти же поисковики индексируют безусловно очень достойный сайт www.a2m.ru - Авиация Второй Мировой, на котором найдена явно релевантная (и по Гуглю, и по Рамблеру) страница, соответствующая вышецитированному запросу:

- найдено документов: 223 - Rambler - обратите внимание, что он выдал по этому тех. запросу...
- Результат поиска: страниц - 188 - Yandex - и вы посмотрите, что Яндекс выдал в начале выдачи по этому тех. запросу!...
- приблизительно 178 из домена www.a2m.ru - Google

Если посмотреть внимательно на результат выдачи Яндекса по тех. запросу о числе проиндексированных страниц на сервере, то можно сделать вывод, что в индексную базу Яндекс спокойно заливает страницы форума (причём стандартного и легко распознаваемого) - из всех наблюдаемых в базе Яндекса страниц www.a2m.ru, страниц форума не менее трети.
Упомянутого текста выступления Сталина в базе Яндекса (публично показываемой по крайней мере) по этому сайту действительно нет. Зато есть Выступление по радио В. М. Молотова от 22 июня 1941 года - со знаменитыми Наше дело правое. Враг будет разбит. Победа будет за нами. и отрывок из Майн Кампф Гитлера (пруссонацистам понравится...).
Эти же документы есть в индексной базе и Гугля, и Рамблера... (и, кстати, тексты выступления Сталина, Молотова, отрывок из Майн Кампф связаны на анализируемом сайте ссылочным навигатором! - как Яндекс потерял текст выступления Сталина - просто загадка :))

Разумеется, во-первых, это данные на текущий момент, а во-вторых - это только примеры, желающие могут самостоятельно проверить качество индексации и выдачи указанных поисковых систем на других запросах.

Но я всё же осмелюсь сделать следующие выводы:
- Yandex явно и всё более рекламирует через выдачу рефераты, цитаты и аннотации книг, а не конкретные документы, отвечающие данному запросу. То, что технически не составляет особого труда выявить спрос именно на документы, а не их куски - это вообще не вопрос. Вопрос в том - случайное ли это совпадение, попустительство или намеренная политика?
- Аналогичный вывод можно сделать и по Google в англоязычном секторе - Google всё более фортит сайтам, предоставляющим платный доступ к документам и продажу книг (через аннотации или рецензии к книгам). Желающие могут внимательно посмотреть выдачу, например, по запросу Antanta Civil war. Тут и сомнения быть не может в намеренной политике.
- Технически выдача ссылок на куски текстов, а не ссылок на целые тексты (NB: при наличии ограниченного/платного доступа ко всему тексту как пользователю, так и стороннему к данному сайту поисковику) проще и, при росте объёма информации, - самое лёгкое решение задачи поиска документов и построения их релевантного ранжирования по запросу с ключевыми словами...

поисковые системы, google, yandex, rambler

Previous post Next post
Up