Выложенный мной вчера
рейтинг уникальности аудитории ЖЖ позволяет сделать весьма интересные выводы. Например, определить приблизительный процент ботов в аудитории блога. Как это можно вычислить?
Как вы знаете, у меня есть база данных всех пользователей кириллического ЖЖ и их связей. Включая их друзей, друзей друзей и так далее до бесконечности. Допустим, что на первом миллионе позиций рейтинга по социальному капиталу количество ботов существенно меньше чем в остальных. Это достаточно верное предположение, так как для получения СК нужны друзья, реальная посещаемость и наполняемость блога, а у ботов с этим очень туго. Так как пользователей в кириллической базе у меня получилось 9 811 720, то первые ~10% будут хорошей выборкой. Большинство ботов окажется за этими пределами.
Первый миллион рейтинга пользователей читают, с учетом повторов, 36 355 196 других . То есть можно сделать предположение, что каждый живой автор уютненькой подписан, примерно на 36,4 журналов. Тогда средняя доля «уникальности аудитории», которую он приносит своим читателям равняется 1/36,4. Умножив это число на количество читателей блога, мы получим эталонную уникальность его аудитории, без ботов. Боты характерны тем, что френдят в основном своих владельцев. Им незачем увеличивать популярность других журналов. Правда иногда, для запутывания систем контроля, они френдят себе подобных и случайных пользователей. Однако концентрация ботов у махровых ботоводов будет запредельная. Например, возьмем пользователя
ios. У нее на конец ноября было 9 388 друзей, а уникальность (которая тоже измеряется в пользователях) была 7 925, при эталонной 258. То есть примерно 82,5% ((7-925 - 258) / 9 388) ее френдов не читают больше никого. Показательное ботоводство налицо.
Давайте применим те же самые рассуждения для наших 20-ти топовых блоггеров. Каков процент ботов у них в аудитории? Его мы рассчитаем по формуле 100 * (Ur - Ue) / FriendsOfCount, где Ur - реальная уникальность, Ue - эталонная, равная FriendsOfCount / 36,4, а FriendsOfCount - количество читателей блога. И вот чтополучится:
ЖурналУникальностьЭталонная уник.В друзьях уБотов в друзьях% ботов в друзьях1
drugoi428121267739321552.8%2
tema589820307389338685.2%3
zyalt241113825031310292.0%4
sergeydolya369717356315919623.1%5
navalny715718846858352737.7%6
mi3ch1116997363111190.3%7
shpilenok1248982357742650.7%8
miumau940774282061650.6%9
prostitutka_ket22927872865415045.3%10
belonika254111484180213923.3%11
eprst200013731075391572970.8%12
nicety743554201701890.9%13
ibigdan1593719262058733.3%14
borisakunin211310043657211083.0%15
radulova1053719261823341.3%16
pesen_net24861536559129501.7%17
dpmmax56150618419550.3%18
teh_nomad416969225223347613.8%19
avmalgin4294271556710.0%20
dolboeb16081048381715591.5%
Какой из этого можно сделать вывод? Получается, что вопреки расхожему мнению, топожители ботоводами не являются. Процент искусственной аудитории у них весьма не велик. Выделяется только
teh_nomad с его 13%, но с таким техническим ником это неудевительно. Роботов так и тянет к нему. Так же относительно большой процент (7,7%) ботов у
navalny. В политике, видимо, без этого никак. На третем месте почему-то идет
tema с 5,8%. Я думал, что
drugoi его обгонит, а оно вон как получается. Видимо Тёма гораздо больше известен за пределами ЖЖ, поэтому разработчики ботов тянутся к нему, а не к кому-нибудь другому.
PS. Ситуация с Навальным меня заинтересовала, и я решил проверить другую сторону баррикад, а именно пламенную активистку Едра
krispotupchik. У нее все еще хуже:
ЖурналУникальностьЭталонная уник.В друзьях уБотов в друзьях% ботов в друзьях567
krispotupchik13141856762112816.7%
Целых 16.7% ботов в аудитории. Да, политика дело такое, не слишком чистое.Если хотите узнать, как обстоят дела с ботами у вас, пишите в каменты. Френдам вне очереди. Для тех кто еще не успел, можете
добавить меня здесь.
Репосты всячески приветствуются.