Про жж-шный поиск.

Apr 05, 2015 17:58

Пришел к выводу что яндексовский поиск совсем нихрена не ловит мышей в ЖЖ ( Read more... )

lj

Leave a comment

Re: яндексовский поиск совсем нихрена не ловит мышей в Ж mpd April 5 2015, 15:22:24 UTC
Не от хорошей жизни.
Я когда игрался с Флексум (был такой сайт у АиП, где можно было свой поиск создавать), не мог понять, чего это мои инструкции на индексирование ЖЖ платформа не выполняет.
Оказалось, что ЖЖ делает всё возможное, чтобы уважающие правила индексирования (специальные nofollow-атрибуты тэгов, меты в хедерах страницы, и т.д.) система не могла бы проиндексировать остальную часть твоего ЖЖ, отталкиваясь от одной конкретной страницы.

Например, вот, что я сейчас увидел на странице своего журнала в заголовке:

Reply

Re: яндексовский поиск совсем нихрена не ловит мышей в Ж vitus_wagner April 5 2015, 15:47:32 UTC
У меня в настройках выключена опция "мимимизировать попадание сайта в поисковые машины".

Reply

Re: яндексовский поиск совсем нихрена не ловит мышей в Ж mpd April 5 2015, 15:54:19 UTC
У меня изначально - тоже всегда отключено минимизировать попадание.
Но - помогает ли это благородному дону?
:-(

Reply

Re: яндексовский поиск совсем нихрена не ловит мышей в Ж vitus_wagner April 5 2015, 16:22:54 UTC
Ну посты не более чем 5-летней давности как-то находятся. А вот потребовалось 10-летней - опаньки.

Reply

Re: яндексовский поиск совсем нихрена не ловит мышей в Ж mpd April 5 2015, 18:52:32 UTC
Очевидно, пауку просто невозможно до тех записей добраться, не нарушая инструкций, о которых я ранее говорил.

Я, например, взял и создал дайджест своего блога и везде воткнул ссылку на эту страницу:
http://mpd.livejournal.com/46894.html

Думаю, если яндексу каким-то образом сообщить все ссылки на страницы старые - он в какой-то момент вдруг начнёт по ним результаты выдавать.

Reply

Re: яндексовский поиск совсем нихрена не ловит мышей в Ж rednyrg721 April 5 2015, 16:18:21 UTC
Вот да, тоже этим вопросом задавался как-то. Журнал у них можно листать с заглавной страницы до /?skip=380, а дальше идут ссылки на /20xy, которые запрещены в robots.txt у всех, как и /calendar и /tag/. Получается, дальше чем на 400 постов назад пауки поисковиков могут попасть только очень кривыми путями (по ссылке на предыдущий пост и т.д. по цепочке - правда, в случае существования хотя бы одного подзамочного поста эта цепочка оборвется :) ) Ну ещё ссылки откуда-то снаружи помогут, конечно.

Плохо, что нет нигде нормального оглавления со ссылками на все посты, это бы решило проблемы эти.

Reply

Re: яндексовский поиск совсем нихрена не ловит мышей в Ж mpd April 5 2015, 18:57:00 UTC
Я делал руками такой список: http://mpd.livejournal.com/46894.html

Правда, не все поняли тогда - зачем?!

Reply

RE: Re: яндексовский поиск совсем нихрена не ловит мышей hrenov_drummer April 5 2015, 19:50:32 UTC
А вот фиг. Я сейчас через blogs.yandex.ru нашел свой собственный первый пост в ЖЖ, сделанный больше 11 лет назад и уж точно находящийся раньше, чем 400 постов назад. Да и ссылки на него вряд ли ведут.

Reply

Re: яндексовский поиск совсем нихрена не ловит мышей rednyrg721 April 5 2015, 20:00:38 UTC
Думается, что тут лотерея, какие-то посты поисковики выкидывают из индекса, а какие-то нет. Одно понятно, что им не нравится, когда на страницу вообще нет ссылок (с индексируемых страниц).

А гуглом находится, кстати? А обычным яндексом, не blogs.yandex.ru?

Reply

Re: яндексовский поиск совсем нихрена не ловит мышей hrenov_drummer April 5 2015, 20:12:58 UTC
Неа, обычным яндексом и гуллом не ищется.

Reply


Leave a comment

Up