Уникальность аудитории ЖЖ. Неожиданные выводы.

Jan 31, 2013 19:48

Выложенный мной вчера рейтинг уникальности аудитории ЖЖ позволяет сделать весьма интересные выводы. Например, определить приблизительный процент ботов в аудитории блога. Как это можно вычислить?

Как вы знаете, у меня есть база данных всех пользователей кириллического ЖЖ и их связей. Включая их друзей, друзей друзей и так далее до бесконечности. Допустим, что на первом миллионе позиций рейтинга по социальному капиталу количество ботов существенно меньше чем в остальных. Это достаточно верное предположение, так как для получения СК нужны друзья, реальная посещаемость и наполняемость блога, а у ботов с этим очень туго. Так как пользователей в кириллической базе у меня получилось 9 811 720, то первые ~10% будут хорошей выборкой. Большинство ботов окажется за этими пределами.

Первый миллион рейтинга пользователей читают, с учетом повторов, 36 355 196 других . То есть можно сделать предположение, что каждый живой автор уютненькой подписан, примерно на 36,4 журналов. Тогда средняя доля «уникальности аудитории», которую он приносит своим читателям равняется 1/36,4. Умножив это число на количество читателей блога, мы получим эталонную уникальность его аудитории, без ботов. Боты характерны тем, что френдят в основном своих владельцев. Им незачем увеличивать популярность других журналов. Правда иногда, для запутывания систем контроля, они френдят себе подобных и случайных пользователей. Однако концентрация ботов у махровых ботоводов будет запредельная. Например, возьмем пользователя ios. У нее на конец ноября было 9 388 друзей, а уникальность (которая тоже измеряется в пользователях) была 7 925, при эталонной 258. То есть примерно 82,5% ((7-925 - 258) / 9 388) ее френдов не читают больше никого. Показательное ботоводство налицо.

Давайте применим те же самые рассуждения для наших 20-ти топовых блоггеров. Каков процент ботов у них в аудитории? Его мы рассчитаем по формуле 100 * (Ur - Ue) / FriendsOfCount, где Ur - реальная уникальность, Ue - эталонная, равная FriendsOfCount / 36,4, а FriendsOfCount - количество читателей блога. И вот чтополучится:

ЖурналУникальностьЭталонная уник.В друзьях уБотов в друзьях% ботов в друзьях1drugoi428121267739321552.8%2tema589820307389338685.2%3zyalt241113825031310292.0%4sergeydolya369717356315919623.1%5navalny715718846858352737.7%6mi3ch1116997363111190.3%7shpilenok1248982357742650.7%8miumau940774282061650.6%9prostitutka_ket22927872865415045.3%10belonika254111484180213923.3%11eprst200013731075391572970.8%12nicety743554201701890.9%13ibigdan1593719262058733.3%14borisakunin211310043657211083.0%15radulova1053719261823341.3%16pesen_net24861536559129501.7%17dpmmax56150618419550.3%18teh_nomad416969225223347613.8%19avmalgin4294271556710.0%20dolboeb16081048381715591.5%

Какой из этого можно сделать вывод? Получается, что вопреки расхожему мнению, топожители ботоводами не являются. Процент искусственной аудитории у них весьма не велик. Выделяется только teh_nomad с его 13%, но с таким техническим ником это неудевительно. Роботов так и тянет к нему. Так же относительно большой процент (7,7%) ботов у navalny. В политике, видимо, без этого никак. На третем месте почему-то идет tema с 5,8%. Я думал, что drugoi его обгонит, а оно вон как получается. Видимо Тёма гораздо больше известен за пределами ЖЖ, поэтому разработчики ботов тянутся к нему, а не к кому-нибудь другому.

PS. Ситуация с Навальным меня заинтересовала, и я решил проверить другую сторону баррикад, а именно пламенную активистку Едра krispotupchik. У нее все еще хуже:

ЖурналУникальностьЭталонная уник.В друзьях уБотов в друзьях% ботов в друзьях567krispotupchik13141856762112816.7%

Целых 16.7% ботов в аудитории. Да, политика дело такое, не слишком чистое.Если хотите узнать, как обстоят дела с ботами у вас, пишите в каменты. Френдам вне очереди. Для тех кто еще не успел, можете добавить меня здесь.

Репосты всячески приветствуются.

й

Previous post Next post
Up