Оригинал взят у
mashina_s в
Рейтинг ботов! Суперрасследование: сколько живых читателей у звезд Твиттера! Чума просто Письмо, поступившее в редакцию:
Привет.
Пару месяцев назад мы решили проверить на вшивость небольшой список твиттерян и узнать, сколько живых людей их читает на самом деле. Сейчас мы можем позволить себе выложить эти данные в паблик, поэтому делимся ими с вами и ещё одним сайтом.
Технология исследования такая: в 10 потоков скачивались данные по всем фолловерам, живыми признавались юзеры со следующими параметрами:
- был хотя бы один твит в пределах последних 45 дней;
- хотя бы половина твитов из последних 50 содержит русские символы (не включая ретвиты);
- фолловеров > 3 и друзей > 3.
Картинка с данными в аттаче. Делайте с этой информацией что хотите.
С уважением,
Anonymous
Собственно, вот картинка:
Узнать, сколько настоящих читателей у топовых микроблогеров - такая же недостижимая задача, как полностью расследовать убийство Кеннеди или посмотреть все сезоны «Санта Барбары». Однозначного ответа на вопрос «Сколько ботов?» не может быть; сначала нужно определиться, в каких случаях считать пользователя ботом, а в каких - «живым». Авторы данного исследования решили, что «живые» пользователи - те, у кого больше 3 читателей и кто читает более 3 аккаунтов, кто писал хоть один твит за последние 45 дней (преимущественно на русском языке). Выборку стоит признать скорее субъективной, так как среди ботов часто встречаются аккаунты и с десятком фолловеров и твитами, генерируемыми автоматически.
Получается, большинства популярных аккаунтов (назовем их пациентами) не больше 63% живых пользователей. Даже по такой «щадящей» выборке у всех пациентов оказывается на треть меньше «живых» читателей, чем показывает счётчик Твиттера. Получается, боты есть у всех.
Алекс @
morketolog Пеганов, автор блога «Цукерберг позвонит», имеет самый «живой» из представленных аккаунтов - у него 71,25% при 2320 фолловерах. Мы скромно решили не рассматривать статистику нашего собственного аккаунта, поэтому будем считать за эталонного «здорового» пациента Твиттер Пеганова.
С ребятами из «Открытого интернета» ситуация оказалась неоднозначной. До этого момента я думал, что боты в приличном количестве там есть у всех, но оказалось, что @
izdato, @
sazam и @
akolesnikov имеют довольно естественные показатели. Традиционно расстроили @
neznashka (8,75% живых) и @
s_nik (36,69%), а у @
zimarin 10,52% вполне логичны - Саша профессионально
занимаетсясозданием ботнетов. Удивили @
ekozlov (15,81%) - я думал, у Жени больше живых читателей, и @
korobkov (50%) - я был уверен, что у него гораздо больше ботов.
Навальный с его гигантской популярностью не сильно отстал от нормального распределения - у него 38,07%. Странно, что у его соратницы @
4irikova показатель сильно выше - 51,86%.
Довольно средние, а значит, нормальные значения демонстрируют бывший пресс-секретарь движения «Наши» @
mashadrokova, Константин @
rykov, главред «Эха Москвы» @
aavst, журналист @
plushev, гражданская активистка @
4irikova, а также шутники-баянисты @
koffboy и @
Interesno_vsem. Похоже, 40-60% - это нормальное распределение «живых» аккаунтов популярных людей.
Косвенно это подтверждается тем, что у @
kermlinrussia похожий показатель при почти равном количестве фолловеров - 37,18%. Не думаю, что кто-то стал бы сознательно накручивать Кермлина. Забавно, что у официального аккаунта @
kremlinrussia всего 19,20% «живых», что подтверждает теорию: у старых аккаунтов больше неактивных фолловеров.
Самые интересные пациенты - @
tina_kandelaki и @
xenia_sobchak, у которых 25,22% и 32,67% соответственно. Казалось бы, при приблизительно одинаковом количестве фолловеров к Тине подозрений гораздо больше. Тут надо вспомнить, что у Канделаки аккаунт существует с августа 2009, а за это время очень много пользователей стали неактивными, перестали писать и были посчитаны как боты. Собчак же завела свой аккаунт только в конце сентября 2011. Откуда за несколько месяцев у Ксении появилось столько ботов в фолловерах?
Всегда хотел узнать, как поменяется топ Твиттера, если оставить только живых пользователей; возможно, мы сами попробуем сделать более подробное исследование ботов у знаменитостей позднее.
Оказывается, Собчак читают больше, чем Канделаки, @
KermlinRussia читают в полтора раза больше, чем @
KremlinRussia, а баянистов на самом деле читают почти столько же людей, сколько и Кремль.
Название нашей планеты - Земля (Earth), и это знает каждый бот,
Никита Лихачев,
The Twi Journal
http://tjournal.ru/plums/bots-research