Ну, за репрезентативность

Nov 07, 2008 15:30



В кулуарах Хайлоада представители Спайлога не стеснялись утверждать, что их тренды - репрезентативны, а глобальная статистика - хороша. Не хочется обижать хороших людей, но правда дороже.

Вот как выглядит верхушка топа поисковиков за октябрь по версии Spylog Тренды:


Эти данные неплохо согласуются с полной статистикой LiveInternet, но вот данные о поисковых фразах заставляют задуматься о репрезентативности всей конструкции.



Яндекс недавно опубликовал отчет Поиск в интернете: что и как ищут пользователи (осень 2008) (прямой линк на PDF-версию), Top-10 поисковых запросов по версии Яндекса выглядят так:


Оно все довольно ожидаемо - почти сплошные навигационные запросы плюс пара частотных информационных.

Смотрим теперь на статистику liveinternet по переходам с поисковиков, за октябрь, ибо изучаем мы Spylog, а там тоже за октябрь:


Никаких чудес, некоторых получателей навигационного трафика в Li.ru нет (ВКонтакте, Mail.ru, зайцев тоже нет), соответственно статистика по переходам на них - отсутствует. Но общая картина не вызывает отторжения и довольно близка к Яндексовской.

Может быть у Гугла другой трафик? Да, немножко другой: спрашивают photofunia, 4shared. Впрочем, если смотреть не верхнюю десятку, а верхние 50, то трафик с Гугла очень похож на Яндексовский, все те же вечные ценности: погода, порно, рефераты, музыка, футбол, MP3 и анекдоты.

Смотрим теперь в десятку поисковых запросов по версии Spylog:


Я извиняюсь, вы сказали переводчик? Нет, переводчик отличный частотный запрос, если поискать его в статистике запросов Яндекса, то место его - в хвосте первой полусотни по частоте. Но уж всяко не выше новостей-погоды-рефератов. Онлайн переводчик, который у Spylog тоже в десятке, запрос еще менее частотный, место ему во второй сотне по частоте.

Кроме того, оный переводчик вылез на 1-е место с 52-го (где ему и место) - по итогам октября. Очевидно, в систему учета добавили один (прописью) сайт, просто с большим трафиком. Скорее всего, этот сайт - translate.ru (счетчик Spylog там есть). Если один сайт с посещаемостью около 200 тыс. посетителей в сутки (большая, но не запредельная) выводит свой основной запрос на первое место, это вызывает вопросы.

При этом, сумма частот первой десятки по Spylog - довольно большая, около процента. Для запросов не из самого верха списка - это слишком большая суммарная частота, если бы Рунет репрезентовался нормально, было бы меньше.

Все вышесказанное не позволяет считать поисковую статистику Spylog репрезентативной. Liveinternet - тоже не вполне репрезентативен, но там выпадения в высокочастотной части объяснимы, а остаток не вызывает такого отторжения.

Автоматический кросс-пост из блога автора.

liveinternet, поисковые системы, spylog, Рунет, статистика, ложь, Яндекс, наглая ложь

Previous post Next post
Up