Ни на gismeteo.ru, ни на hmn.ru - счётчика спайлога не стоит, так что погода пролетает, это ожидаемо. А вот на translate.ru стоит, имеем "переводчик". Меня вот гораздо больше удивляет сонник на li.ru - но наверное этому тоже есть какое-то логичное объяснение.
На самом деле отторжение у тебя наверняка вызывает в первую очередь отсутствие слова "порно". В спайлоговской статистике его нет по построению - в выборку, по которой строятся тренды, порносайты не включаются.
У меня вызывает отторжение то, что не очень крупный сайт (200k посетителей - это заметно, но сколько из них попадает через поиск?) дал слову +51 позицию и вывел на первое место.
Пятое место в списке слов тоже очень показательно - то, о чем я подумал имеет посещаемость меньше 15 тысяч в день, а реальное место этого запроса - не пятое, а примерно двухсотое.
Жди меня? Они насколько я помню размножались поисковыми запросами в Рамблере, вплоть до призывов в эфире, так что это может быть вполне объяснимо.
Ну и опять же не забывай, что это *посетители*. Т.е. внешние по отношению к интернету факторы влияют куда заметнее, чем внутренние.
Вообще не подумайте что я защищаю глобальную статистику по поисковым фразам как таковую. IMHO она в отрыве от конкретного ресурса имеет мало смысла, и сильно подвержена влиянию всяких очень странных факторов.
Ну я типа пытаюсь продвигать мысль, что частотные запросы в современном интернете - это навигационные запросы, и репрезентативности по ним быть не может по определению. А вылезшая наверх навигация на ресурсы с относительно небольшим реальным трафиком - это как раз показатель доли поискового трафика у этих ресурсов.
Надо будет посмотреть как меняется картинка если статистику строить не по пресловутой выборке, а вообще по всему что есть.
BTW, заметил прикольную багу - в графе "Прочее" на трендах - цена на дрова. Послал лучи ответственным.
новости-порно-погода-рефераты - это не навигационные запросы. И переводчик - тоже, кстати.
Вообще, если взять верхушку из liveinternet и сопоставить им чистые частоты - то картина не будет столь ужасающей (и по навигационным запросам тоже), как у вас.
Проблема не в том что думают люди когда вводят запросы, а в том куда они в результате попадают. Про погоду я уже писал выше. Т.е. фактически - нет счётчика на одном-двух сайтах - запрос из топов вылетает.
С новостями и рефератами - пока не так, но они у нас и стоят в десятке.
Я не утверждаю что у нас лучше чем в liveinternet'е, очевидно что у них сейчас охват больше. Но в целом IMHO у нас не то чтобы очень плохо.
Ну вот смотри - по навигационным запросам (верхушке) - нерепрезентативны.
По информационным - опять по верхушке - та же фигня (погоду, игры и порно - зафильтровали, а остальное лезет какое-то очень случайное (ну вот аватары на 20-м месте). А показываете вы - маленький кусочек. Вот что показали публично - нерепрезентативно (аэрофлот выше работы?).
Что там при этом с распределением по поисковикам - неясно. Ну вот признали, что по словам фильтруете, чтобы порно не пролезло. И, значит, настаиваете, что фильтрованая статистика - очень даже хорошая.
Не на странице, а на страницах, для переводчика я их 57 штук насчитал.
Но не совсем так, потому что если у тебя такие запросы (3 штуки всего) переводчик 100 онлайн переводчик 50 онлайн переводчик порно 20 то чистая частота переводчика будет 50, ибо третий запрос полностью всосан вторым (и как на самом деле Яндекс их складывает - мы только примерно знаем, запросов длиннее 5 слов в wordstat я не видел, а в жизни они есть и их много)
Ну и в wordstat тебе показывают все с частотой более 5, хотя для случая совсем частотного, вроде собственно переводчика - вклад совсем уж низкочастотки невелик (а вот например для слова nokia - похоже что очень велик).
На самом деле отторжение у тебя наверняка вызывает в первую очередь отсутствие слова "порно". В спайлоговской статистике его нет по построению - в выборку, по которой строятся тренды, порносайты не включаются.
Reply
Пятое место в списке слов тоже очень показательно - то, о чем я подумал имеет посещаемость меньше 15 тысяч в день, а реальное место этого запроса - не пятое, а примерно двухсотое.
Reply
Ну и опять же не забывай, что это *посетители*. Т.е. внешние по отношению к интернету факторы влияют куда заметнее, чем внутренние.
Вообще не подумайте что я защищаю глобальную статистику по поисковым фразам как таковую. IMHO она в отрыве от конкретного ресурса имеет мало смысла, и сильно подвержена влиянию всяких очень странных факторов.
Reply
Обсуждаем репрезентативность.
Reply
Надо будет посмотреть как меняется картинка если статистику строить не по пресловутой выборке, а вообще по всему что есть.
BTW, заметил прикольную багу - в графе "Прочее" на трендах - цена на дрова. Послал лучи ответственным.
Reply
Вообще, если взять верхушку из liveinternet и сопоставить им чистые частоты - то картина не будет столь ужасающей (и по навигационным запросам тоже), как у вас.
Reply
С новостями и рефератами - пока не так, но они у нас и стоят в десятке.
Я не утверждаю что у нас лучше чем в liveinternet'е, очевидно что у них сейчас охват больше. Но в целом IMHO у нас не то чтобы очень плохо.
"Ну ужас конечно. Но не ужас-ужас-ужас." (c) :)
Reply
По информационным - опять по верхушке - та же фигня (погоду, игры и порно - зафильтровали, а остальное лезет какое-то очень случайное (ну вот аватары на 20-м месте).
А показываете вы - маленький кусочек. Вот что показали публично - нерепрезентативно (аэрофлот выше работы?).
Что там при этом с распределением по поисковикам - неясно. Ну вот признали, что по словам фильтруете, чтобы порно не пролезло. И, значит, настаиваете, что фильтрованая статистика - очень даже хорошая.
Reply
Reply
http://wordstat.yandex.ru/advq?rpt=ppc&key=&shw=1&tm=&checkboxes=&text=%F1%EE%ED%ED%E8%EA®ions_text=%C2%F1%E5®ions=
переводчик - 689942 показов в месяц
http://wordstat.yandex.ru/advq?rpt=ppc&key=&shw=1&tm=&checkboxes=&text=%EF%E5%F0%E5%E2%EE%E4%F7%E8%EA®ions_text=%C2%F1%E5®ions=
Я полностью согласен что Яндекс может врать куда больше чем все остальные фигуранты данного обсуждения, но ты вроде на него сам ссылался, нет?
Есть ещё версия что я Яндексом пользоваться не умею, поправь меня если что.
Reply
Чистая частота у переводчика - втрое (чуть больше) ниже.
Reply
Reply
Но не совсем так, потому что если у тебя такие запросы (3 штуки всего)
переводчик 100
онлайн переводчик 50
онлайн переводчик порно 20
то чистая частота переводчика будет 50, ибо третий запрос полностью всосан вторым (и как на самом деле Яндекс их складывает - мы только примерно знаем, запросов длиннее 5 слов в wordstat я не видел, а в жизни они есть и их много)
Ну и в wordstat тебе показывают все с частотой более 5, хотя для случая совсем частотного, вроде собственно переводчика - вклад совсем уж низкочастотки невелик (а вот например для слова nokia - похоже что очень велик).
Reply
Leave a comment