Рынок и... алгоритмы ранжирования поисковиков.

Sep 04, 2008 02:14

Прислал далёкий от интернет-бизнеса, seo, программирования и т.п. человек, с кем я не общаюсь на подобные темы (цитирую, не изменив ни слова, ни форматирования):
Поисковики, и гугль и яндекс, стали отвратительными.
Вводишь имя и ключевые слова - дают тыщу ссылок.
И ПОЧТИ ПО КАЖДОЙ ССЫЛКЕ - не материал по теме, а сотни заголовков и заголовочков.
Идиотизм! пытать и вешать!!
Но любой, хоть слабо знакомый... нет, даже не с программированием, а с логикой человек врядли поверит, что автоматически невозможно отличить содержательный текст от набора ссылок. И, тем не менее... А что же это за сайты такие, где «почти по каждой ссылке - не материал по теме, а сотни заголовков и заголовочков»? Ой, да сейчас уже даже неприлично произносить это слово *) - жлобы бабло качают, извиняюсь, люди деньги делают, а вы чего-то там бухтите, лузеры.

Помнится, ещё лет 5 назад существовало такое противостояние - поисковиков и seo (которых поголовно и с 90%-ой вероятностью верно первые считали жуликами). Были какие-то жаркие споры о том, что Яндекс должен открыто декларировать что хорошо, а что плохо, и на требующих такое почему-то не смотрели как на идиотов, потому что все понимали, что они, требующие, не идиоты - просто они так сублимируют: делитесь, программистеги хреновы! мы! хотим! денег! нам! мало!
Кто-то замечает такое противостояние сейчас? Да ну нет. После того, как на какой-там конференции (точнее, ещё раньше - в кабаке ресторане, пустив бухло трубку мира по кругу seo-барыг из некоторой известной конторы и топ-менеджеров поиска Яндекса) было со всею серьёзностью заявлено, что теперь поисковики и seo дружат, теперь они мухлюют за одно поделили рынок... Потому что только seo могли снабдить Яндекс потоком клиентуры на покупку контекстной рекламы, и потому что на дорвеях удобнее всего размещать рекламу, их удобнее всего индексировать как релевантные (см. ниже) и грести прибыль с кликов обеим сторонам. Ибо пользователь едва ли будет безумно кликать там, где обнаружил нужную информацию, поэтому для того, чтобы он стал кликать на что ни попадя, его надо довести до определённой кондиции. Явно или неявно seo снабдили Яндекс клиентурой - неважно, но я думаю, что явно - хорошо бы даже посмотреть рост кликов/показов на Директе (рекламный брокер Яндекса) до и после заключения оного полюбовного соглашения...
И юзеры, подсаженные на единственных и неповторимых производителей мега-супер-технологий как на кактус, будут колоться, плакать, но жрать их выдачу.

А ещё года два назад почему-то было в чести такое слово, как «релевантность» (по ссылке много пафосных заявлений). Примерно тогда же (2006г) Яндексом была выпущена статья об алгоритме ранжирования Яндекса (там ничего сложного, ничего такого, что было неизвестно до 2006г, и школьного курса математики достаточно для понимания) - где речь идёт о ранжировании текстов, никак не связанных друг с другом, но при том про интеренет!
И догадайтесь, что за сайты вероятнее всего попадут в релевантные данному запросу при алгоритме, который предлагает (цитирую) еще небольшой «бонус» WHalfPhrase дается за наличие в тексте предложений, содержащих значительное количество слов запроса? С какого такого перепугу за откровенный спам словесное недержание должен даваться бонус при ранжировании документа?? Но зато как же хорош такой алгоритм для дорвеев с кучей одних и тех же слов! О да, в самом конце статьи честно упомянуто, что весь алгоритм тестировался на коллекции документов РОМИПа, а вот в интернете полно спама. Но какой смысл тогда всей статьи, которую представляют нам не студенты какие-нибудь, в качестве курсовой (на диплом не тянет, по-моему) а солидные такие дяди? - техдиректор, ведущий (что ли) разработчик/аналитег и руководитель отдела поисковых технологий Яндекса... И ведь, ей-богу, наблюдая выдачу, есть все основания полагать, что именно такой алгоритм Яндекс и пользует... Раз его светила не могли представить ничего более актуального и адекватного, в качестве статьи под названием «Алгоритм текстового ранжирования Яндекса». Не какого-то там на коленке писанного поисковика для десктопов, а Яндекса! (про то, что алгоритм представлен для десктопов в статье нет ни слова - там сразу же заявлено, что речь пойдёт про поиcковые системы интернета).
И ничего нет такого страшного в том, чтобы представить публике алгоритм ранжирования, учитывающий связность документов в сети. Представил же Гугль во время оное формулу вычисления своего PageRank-а.
Однако руководство Яндекса окутывает егойные мега-супер-технологии завесой интимной тайны и кормит стороннего наблюдателями какими-то детскими сказками про свои алгоритмы ранжирования. И как-то получается, по результатам выдачи, что они у него и правда похожи на такие, как заявленные, или почти на такие.
А всё, что кроме них... - «это рынок, детка»... Ничего боле.
Интересно, дождутся ли пользователи каких-то комментариев от руководства Яндекса по поводу того - из-за чего в выдаче столько много дорвеев? И почему Яндекс не может их вырезать оттуда? Вопрос уже поднимался. Видимо, сложный он очень. Ага. Награда Яндексу за то - линкбомбинг по одному интересному запросу. Вот что значит, опозориться, так опозориться...
Куда уж хуже. Зато сколько восторгов о грядущем выходе компании на IPO... - Дык пора уже! созрели!

*) дорвей - автоматически созданный сайт, насыщенный ключевыми словами и перенаправляющий посетителя в другие места, часто тоже весьма отдалённые от того, что он ищет

coding, seo, scale-free networks

Previous post Next post
Up