Яндекс — прописные и строчные

Aug 22, 2005 06:01


Блог-поиск Яндекса учитывает (зачем-то): «прописные или строчные буквы использовались в запросе?» На момент написания этой записи (без десяти шесть, 22-го августа) — очень похожие запросы, дают различные результаты:

Не радует…

blog, search, bug, lj

Leave a comment

Comments 14

alisher August 22 2005, 07:06:55 UTC
Действительно, странно. Вроде ж должен один и тот же движок для поиска использоваться, а в описании сказано: «Если вы набрали в запросе слово с большой буквы, будут найдены только слова с большой буквы (если это слово не первое в предложении), в противном случае будут найдены как слова с большой, так и с маленькой буквы».

P.S. Кстати, почему-то пишут «большая буква» и «маленькая буква», а не «строчная» и «прописная». Наверное, чтобы к народу ближе быть. :)

Reply

illyn August 22 2005, 07:32:58 UTC
Какой-то воистину зарубежный движок крутится на поиске по Блогам.

Насколько я знаю (например по тому как работают интересы, тут в ЖЖ) существуют какие-то заморочки - латинские буквы стабильно понимаются и учитываются как одинаковые, а вот русские - прописные и строчные символы - они всегда разные.

Что ещё забавно - вот этот пост, сейчас проверил, тоже должен находится - так он находится только в 2 запросах из вышеупомянутых 3-ёх.
Хотя в нём есть все три текста.

Reply


dejavuefatale August 22 2005, 11:00:04 UTC
Не радует, да.
Ещё вот это и это в перспективе не радует.

Reply

illyn August 22 2005, 11:11:21 UTC
«это» и «это» - по-моему нормально.

В любом случае таковая персонификация языков нужна для того, что бы работал опережающий поиск. Не уверен, правда, что у Яндекса получится его создать (я то им не говорю, что надо делать :)) но понимать, быть гибким - всё «неправильное» - это правильно!

P.S. Насчёт того, что не радует, меня сегодня поросили писать туда кстати, а не к себе. Если есть соображения почему «это» и «это» плохо и они достаточно весомые - я думаю имеет смысл ими с разработчиками подедлиться.

Reply

dejavuefatale August 22 2005, 20:39:53 UTC
Нормально в случае со словами-неологизмами, которые не входят в традиционные словари и о которых нет ещё единого мнения. Однако если поиск будет подстраиваться под неграмотное написание общепринятой орфограммы, вот это будет тревожно. Хотя Кукуц ниже этот ключевой для меня вопрос уже снял.
P.S. Они уже сами меня нашли. =)

Reply

kukutz August 22 2005, 14:15:34 UTC
QBS не исключает словарный спеллер, а дополняет.

Reply


illyn August 22 2005, 12:53:35 UTC
Да. Но заметь, текущий счёт:
19, 0, 3

По запросам которые в посте.

P.S. Кукуцу пожаловался. Ибо. !

Reply


kukutz August 23 2005, 09:38:36 UTC
Средний запрос отличается тем, что сделан в уникоде.

Именно поэтому ничего не находится.

Автораспознавания пока нет, поэтому для уникода есть специальный параметр charset=utf-8.

Reply

illyn August 23 2005, 09:43:16 UTC
Вон оно как. Неудобно. Я ведь непонимаю, когда у меня уникод из браузера выделяется, когда ещё что. Вы уж займитесь этим вопросом.

Reply

kukutz August 23 2005, 10:04:13 UTC
Ага.

Reply


zubo September 13 2005, 12:14:10 UTC
А сейчас они ситуация наполовину исправили :)
"Счет" 25, 25, 3.

Reply

illyn September 13 2005, 12:20:24 UTC
Прогресс «по шагам» - тоже прогресс!

Reply


Leave a comment

Up