Comments | illyn: Яндекс прописные и строчные

illyn

Яндекс прописные и строчные

Aug 22, 2005 06:01

Блог-поиск Яндекса учитывает (зачем-то): «прописные или строчные буквы использовались в запросе?» На момент написания этой записи (без десяти шесть, 22-го августа) очень похожие запросы, дают различные результаты:

Немецкая волна блог: найдено 7 ссылок
немецкая волна блог: ничего не найдено
Немецкая Волна блог: ничего не найдено

Не радует…

blog, search, bug, lj

Comments 14

alisher August 22 2005, 07:06:55 UTC

Действительно, странно. Вроде ж должен один и тот же движок для поиска использоваться, а в описании сказано: «Если вы набрали в запросе слово с большой буквы, будут найдены только слова с большой буквы (если это слово не первое в предложении), в противном случае будут найдены как слова с большой, так и с маленькой буквы».

P.S. Кстати, почему-то пишут «большая буква» и «маленькая буква», а не «строчная» и «прописная». Наверное, чтобы к народу ближе быть. :)

illyn August 22 2005, 07:32:58 UTC

Какой-то воистину зарубежный движок крутится на поиске по Блогам.

Насколько я знаю (например по тому как работают интересы, тут в ЖЖ) существуют какие-то заморочки - латинские буквы стабильно понимаются и учитываются как одинаковые, а вот русские - прописные и строчные символы - они всегда разные.

Что ещё забавно - вот этот пост, сейчас проверил, тоже должен находится - так он находится только в 2 запросах из вышеупомянутых 3-ёх.
Хотя в нём есть все три текста.

dejavuefatale August 22 2005, 11:00:04 UTC

Не радует, да.
Ещё вот это и это в перспективе не радует.

illyn August 22 2005, 11:11:21 UTC

«это» и «это» - по-моему нормально.

В любом случае таковая персонификация языков нужна для того, что бы работал опережающий поиск. Не уверен, правда, что у Яндекса получится его создать (я то им не говорю, что надо делать :)) но понимать, быть гибким - всё «неправильное» - это правильно!

P.S. Насчёт того, что не радует, меня сегодня поросили писать туда кстати, а не к себе. Если есть соображения почему «это» и «это» плохо и они достаточно весомые - я думаю имеет смысл ими с разработчиками подедлиться.

dejavuefatale August 22 2005, 20:39:53 UTC

Нормально в случае со словами-неологизмами, которые не входят в традиционные словари и о которых нет ещё единого мнения. Однако если поиск будет подстраиваться под неграмотное написание общепринятой орфограммы, вот это будет тревожно. Хотя Кукуц ниже этот ключевой для меня вопрос уже снял.
P.S. Они уже сами меня нашли. =)

kukutz August 22 2005, 14:15:34 UTC

QBS не исключает словарный спеллер, а дополняет.

Thread 5

seabreeze August 22 2005, 12:46:27 UTC

Ты найден:)
http://blogs.yandex.ru/search.xml?how=tm&rd=2&text=%CD%E5%EC%E5%F6%EA%E0%FF+%C2%EE%EB%ED%E0+%E1%EB%EE%E3

illyn August 22 2005, 12:53:35 UTC

Да. Но заметь, текущий счёт:
19, 0, 3

По запросам которые в посте.

P.S. Кукуцу пожаловался. Ибо. !

kukutz August 23 2005, 09:38:36 UTC

Средний запрос отличается тем, что сделан в уникоде.

Именно поэтому ничего не находится.

Автораспознавания пока нет, поэтому для уникода есть специальный параметр charset=utf-8.

illyn August 23 2005, 09:43:16 UTC

Вон оно как. Неудобно. Я ведь непонимаю, когда у меня уникод из браузера выделяется, когда ещё что. Вы уж займитесь этим вопросом.

kukutz August 23 2005, 10:04:13 UTC

Ага.

zubo September 13 2005, 12:14:10 UTC

А сейчас они ситуация наполовину исправили :)
"Счет" 25, 25, 3.

illyn September 13 2005, 12:20:24 UTC

Прогресс «по шагам» - тоже прогресс!

Яндекс  прописные и строчные

Comments 14

Яндекс прописные и строчные