Рейтинг ботов! Суперрасследование: сколько живых читателей у звезд Твиттера! Чума просто

Mar 02, 2012 16:52



Письмо, поступившее в редакцию:

Привет.

Пару месяцев назад мы решили проверить на вшивость небольшой список твиттерян и узнать, сколько живых людей их читает на самом деле. Сейчас мы можем позволить себе выложить эти данные в паблик, поэтому делимся ими с вами и ещё одним сайтом.

Технология исследования такая: в 10 потоков скачивались данные по всем фолловерам, живыми признавались юзеры со следующими параметрами:

- был хотя бы один твит в пределах последних 45 дней;
- хотя бы половина твитов из последних 50 содержит русские символы (не включая ретвиты);
- фолловеров > 3 и друзей > 3.

Картинка с данными в аттаче. Делайте с этой информацией что хотите.

С уважением,
Anonymous

Собственно, вот картинка:



Узнать, сколько настоящих читателей у топовых микроблогеров - такая же недостижимая задача, как полностью расследовать убийство Кеннеди или посмотреть все сезоны «Санта Барбары». Однозначного ответа на вопрос «Сколько ботов?» не может быть; сначала нужно определиться, в каких случаях считать пользователя ботом, а в каких - «живым». Авторы данного исследования решили, что «живые» пользователи - те, у кого больше 3 читателей и кто читает более 3 аккаунтов, кто писал хоть один твит за последние 45 дней (преимущественно на русском языке). Выборку стоит признать скорее субъективной, так как среди ботов часто встречаются аккаунты и с десятком фолловеров и твитами, генерируемыми автоматически.

Получается, большинства популярных аккаунтов (назовем их пациентами) не больше 63% живых пользователей. Даже по такой «щадящей» выборке у всех пациентов оказывается на треть меньше «живых» читателей, чем показывает счётчик Твиттера. Получается, боты есть у всех.



Алекс @ morketolog Пеганов, автор блога «Цукерберг позвонит», имеет самый «живой» из представленных аккаунтов - у него 71,25% при 2320 фолловерах. Мы скромно решили не рассматривать статистику нашего собственного аккаунта, поэтому будем считать за эталонного «здорового» пациента Твиттер Пеганова.

С ребятами из «Открытого интернета» ситуация оказалась неоднозначной. До этого момента я думал, что боты в приличном количестве там есть у всех, но оказалось, что @ izdato, @ sazam и @ akolesnikov имеют довольно естественные показатели. Традиционно расстроили @ neznashka (8,75% живых) и @ s_nik (36,69%), а у @ zimarin 10,52% вполне логичны - Саша профессионально занимаетсясозданием ботнетов. Удивили @ ekozlov (15,81%) - я думал, у Жени больше живых читателей, и @ korobkov (50%) - я был уверен, что у него гораздо больше ботов.

Навальный с его гигантской популярностью не сильно отстал от нормального распределения - у него 38,07%. Странно, что у его соратницы @ 4irikova показатель сильно выше - 51,86%.

Довольно средние, а значит, нормальные значения демонстрируют бывший пресс-секретарь движения «Наши» @ mashadrokova, Константин @ rykov, главред «Эха Москвы» @ aavst, журналист @ plushev, гражданская активистка @ 4irikova, а также шутники-баянисты @ koffboy и @ Interesno_vsem. Похоже, 40-60% - это нормальное распределение «живых» аккаунтов популярных людей.

Косвенно это подтверждается тем, что у @ kermlinrussia похожий показатель при почти равном количестве фолловеров - 37,18%. Не думаю, что кто-то стал бы сознательно накручивать Кермлина. Забавно, что у официального аккаунта @ kremlinrussia всего 19,20% «живых», что подтверждает теорию: у старых аккаунтов больше неактивных фолловеров.

Самые интересные пациенты - @ tina_kandelaki и @ xenia_sobchak, у которых 25,22% и 32,67% соответственно. Казалось бы, при приблизительно одинаковом количестве фолловеров к Тине подозрений гораздо больше. Тут надо вспомнить, что у Канделаки аккаунт существует с августа 2009, а за это время очень много пользователей стали неактивными, перестали писать и были посчитаны как боты. Собчак же завела свой аккаунт только в конце сентября 2011. Откуда за несколько месяцев у Ксении появилось столько ботов в фолловерах?

Всегда хотел узнать, как поменяется топ Твиттера, если оставить только живых пользователей; возможно, мы сами попробуем сделать более подробное исследование ботов у знаменитостей позднее.



Оказывается, Собчак читают больше, чем Канделаки, @ KermlinRussia читают в полтора раза больше, чем @ KremlinRussia, а баянистов на самом деле читают почти столько же людей, сколько и Кремль.

Название нашей планеты - Земля (Earth), и это знает каждый бот,
Никита Лихачев,
The Twi Journal

http://tjournal.ru/plums/bots-research

Previous post Next post
Up