В развитие темы
ботов и ботоводства.
Зачем нужно определять ботов
Социальные сети стали очень важной информационной составляющей в жизни человека. И эта значимость только усиливается. Получение информации (в т.ч. и новостей), обсуждение этой информации (обмен мнениями, комментариями), выработка решений и рекомендаций, распространение информации. Соцсети становятся основным каналом распространения информации между людьми - не исключено, что и монопольным станет. По крайней мере в каких то социальных группах точно. А канал распространения информации, тем более монопольный, всегда интересен и бизнесу, и государству, и криминалу. Для бизнеса это и получение обратной связи от клиента во всем ее многообразии, и агентурная сеть для конкурентной разведки, и система раннего предупреждения. Для государства это отслеживание социальной напряженности, для криминала это поиск и изучение жертв. Но это пассивное использование инструмента. А ведь возможно и его активное использование - манипулирование целевой аудиторией. Другими словами это те самые информационные войны разного масштаба.
Но для информационных войн важно иметь возможность эффективно воздействовать на целевую аудиторию. А это в первую очередь возможность быстрого доведения ударной информации (ее распространение), для чего необходимо в короткий срок массово распространить ваш контент среди выбранной аудитории. Вот тут то и возникает необходимость в автоматизации процесса, так как целевая аудитория может быть большой (если речь об информационных войнах межгосударственного масштаба), может быть разношерстной по местам локализации (социальным сервисам), может иметь разные периоды активности (разные часовые пояса), может иметь разные «вкусовые» предпочтения. Значит нужно иметь возможность многократно продублировать информацию в разных социальных сетях, от имени разных аккаунтов, в разное время, с разным оформлением. Вручную это достаточно трудоемко. Вот тут и нашли применение боты.
В силу простоты создания и эффективности использования ботов становится всё больше и больше. «В группах крупных компаний в социальной сети "ВКонтакте" зафиксировано до 76% ботов. Об этом заявил заместитель генерального директора компании "ВКонтакте" Илья Перекопский во время доклада на конференции "РИФ", открывающего секцию "SMM или мошенничество?"
Из перечисленных брендов самое большое количество ботов - 76% пользователей - было отмечено на странице лапши "Роллтон". Почти столько же - 73% ботов - зафиксировано в группе "Связной банк". В группе Adidas 59% ботов, у Coca-Cola - 37%. В качестве примеров страниц с небольшим количеством ботов Перекопский назвал группы "Сбербанка" (3% ботов), Nescafe (2%), "ЮниКредит Банка" (2%), Pampers (5%).
По словам топ-менеджера, "ВКонтакте" являются основной площадкой для SMM-маркетинга, так как эта социальная сеть по охвату аудитории в России значительно превосходит Facebook и "Одноклассники". По словам Перекопского, экономия на ботах позволяет рекламным агентствам и топ-менеджерам компаний "пилить" неизрасходованные средства.»
Источник Такие соотношения не просто искажают картину, они ее меняют на противоположную. А данные полученные из среды на столько заполненной ботами превращаются в дезинформацию - на их основе нельзя принимать решения.
Поэтому и необходима возможность быстрого (лучше автоматического) выявления ботов. Такое решение позволяет быстро:
- понять носит явление естественный или искусственный характер;
- удалить данные ботов из исследуемых данных, дабы они не искажали картину;
- определить «откуда дует ветер».
Что такое «бот»
Но для начала нужно определиться - что такое бот. Уж очень часто это слово используется и в самых разных интерпретациях. Бот (англ. bot, сокр. от robot) - программа, автоматически выполняющая действия на компьютере вместо людей. Значит это программа или программно-аппаратный комплекс, если речь идет о больших системах, выполняющая некие действия, которые, по идее должен был делать человек. Комментировать чужие реплики, отвечать на такие реплики от посторонних, ставить «лайки», отправлять сообщения…. В общем все те действия, что осуществляет человек в социальной сети, общаясь с себе подобными.
Строго говоря бот это не аккаунт, бот это программа управления аккаунтом. Но в сложившейся сетевой традиции ботом называют именно аккаунты, управляемые этими программами.
Суммируя сказанное, получается, что ботами в сфере информационных войн называют аккаунты в разнообразных социальных сервисах, используемые для распространения целевой информации. Это виртуальные личности разной глубины проработки. Они могут управляться программно (теми самыми ботами) или людьми. Во втором случае такие виртуальные личности нередко именуют троллями, хотя это тоже не совсем верно. Так вот, речь, в нашем случае, идет о всех вариантах. А признаком отнесения к данной категории является распространение специально подготовленной ударной информации.
Признаки ботов
В определении ботов есть одна особенность - отсутствие однозначного ответа на вопрос бот или не бот. Связано такое положение дел с тем, что точный ответ можно дать только контролируя сам аккаунт, а такой возможностью обладает лишь его владелец. Поэтому оперируем понятиями нечеткой логики. А сама система оценки близка по своей сути к скоринговой системе, когда принятие решения осуществляется по совокупности признаков, а не по одному показателю. И реализовывать ее нужно именно так - определив перечень показателей и оценив их вес в итоговой оценке.
Статичные признаки
К статичным признакам относятся особенности оформления аккаунта - то как полно занесены данные, какие данные использованы для оформления и т.п.. Рассмотрим некоторые примеры таких признаков.
Корректное написание имени - использование в имени аккаунта не имен. Это признак, который сам по себе только настораживает и используется для определения только в комплексе с другими признаками как дополнительный фактор. Однако, если у вас уже есть выявленные боты, а имя исследуемого аккаунта отличается от них на +1, то это скорее всего бот.
Наличие публикаций аккаунта - если сам ничего не пишет, а только комментирует чужие записи, то это еще один признак ботности. Нередко для имитации жизни такие публикации делаются, но они являются дубликатом уже имеющихся и/или «не в тему». Чаще используется такой показатель как соотношение входящих сообщений к исходящим или комментариев к публикациям.
Наличие и содержание фотографии также является дополнительным признаком «ботности» аккаунта. Содержание фотографии также имеет значение, но формализовать процедуру такой оценки достаточно сложно.
Соответствие друг другу разных данных профайла. Особенно интересно соотносить друг с другом даты. Например дата рождения и дата начала и окончания обучения в школе, в ВУЗе. В спешке оформления (а аккаунты-боты создаются чаще в спешке) нередко ошибаются и тогда оказывается, что в школу пошел в четырехлетнем возрасте или в 11 лет… Конечно-же это не однозначный показатель, а лишь еще один пункт в скоринговую систему оценки ботности.
Дата создания аккаунта - когда нужно создать много ботов, то их создают единовременно и по близости даты создания (или ее совпадения) можно выявлять боты, входящие в одну группировку (управляемых одним ботоводом или участвующих в одном проекте). Но и дата создания сама по себе это дополнительный признак - если аккаунт создан на днях, то доверия к нему меньше. Интересным показателем является соотношение длительности существования аккаунта (дата создания) к его активности (число публикаций или комментариев). Ведь если аккаунт зарегистрирован несколько дней назад, но при этом уже пара тысяч комментариев, то это не обычно, хотя и возможно.
Число фрэндов - тоже интересный показатель. Ведь если у человека нет друзей, пусть и виртуальных, но при этом он активно общается (комментирует), то это не совсем обычно. Поэтому также интересен не сам показатель числа фрэндов, а его соотношение с длительностью существования аккаунта, числом публикаций и числом комментариев (входящих и исходящих).
Общая заполненность профайла - все ли пункты профайла заполнены. Ботов нужно создавать много, а по тому нет времени и желания заполнять профайл. Заносятся минимум данных, только те, которые нужны для регистрации и функционирования.
Поведенческие признаки
К этому типу признаков относятся те особенности, которые характерны для действий изучаемого аккаунта.
Участие в искусственном продвижении материалов ранее указывает на то, что данный аккаунт скорее всего бот. Есть случаи, когда люди свой реальный аккаунт «сдают в аренду» для автоматического распространения некой информации, но они единичны. Для этого существуют своеобразные биржи. Другой вариант - когда чей то реальный аккаунт «угнали» или подобрали пароль и, не афишируя этого, используют его для распространения информации. Но во всех подобных случаях это уже бот.
Скорость комментирования - нормальный человек не может оставлять комментарии со скоростью 1 коммент в секунду. Как минимум нужно прочитать то, что комментируешь, сформулировать ответ и набрать его на клавиатуре. При самых парниковых условиях секунд десять на это уйдет. По этой причине, к стати, более точен показатель основанный на соотношении скорости комментирования к длине самого комментария.
Комментарии разных аккаунтов с одного IP за короткий промежуток времени. Речь идет о ситуации, когда в комментариях одной публикации (например в блоге) «оставили след» несколько аккаунтов за короткий промежуток времени и все с одного IP. Это явное указание на то, что управляются эти аккаунты с одного компьютера (сервиса) или через один прокси-сервер.
Содержание комментариев также может указывать на их нечеловечность - например примитивные комментарии («+100500», «автар жжет», «убейся абстену»). Безусловно, это может написать и человек, а по тому это лишь дополнительный признак. Другой вариант - комментарии «не в тему», когда содержание комментария не соответствует содержанию общения. Еще один вариант - точные дубли других комментариев, особенно, когда дублируется многократно (десятки, сотни дублей) за короткий промежуток времени. Но здесь нужно учитывать такое явление как цитаты. Достаточно примеров, когда некое короткое высказывание нравится публике и его начинают распространять именно люди, дублируя.
С уважением!
Нежданов Игорь