Одним из заметных событий Евромайдана стала нашумевшая отмена нашумевшего-же закона о языках. Так-как анализировать отражение еще не текущих политических событий - удел политологов, я решил посмотреть на каких языках и насколько активно обсуждаются текущие события. Сразу замечу, что за прошедшее время новостные акценты менялись, но
принцип сбора твитов нет, впрочем как и понятные
ограничения репрезентативности выборки. По состоянию на сегодняшний день распределение общего количества твитов по языковому признаку выглядит
так:
ru---1635590
uk---1418830
en---652959
lt---103103
bg---56861
sk---27407
de---25985
und---15336
es---10093
in---5560
fr---5337
et---3702
it---2117
sl---1787
id---1433
nl---1074
pl---955
tl---630
fi---614
vi---362
da---338
ht---276
tr---271
sv---213
no---183
lv---101
pt---86
hu---44
is---37
В принципе, на первый взгляд, ничего удивительного - русский и украинский основные языки, некоторый перевес русского можно объяснить тем, что русскоязычным украинцам "помогают" жители России и Беларуси. Третьим из доминирующих языков (правда со значительным отрывом) ожидаемо оказался английский, правда обьясняется это прежде всего не новостями в англоязычных сми или очень бурным обсуждением в среде англоязычных пользователей, а, как показано
тут и в нескольких последующих постах, продвижением Евромайдана в топ твитера благодаря спланированной компании. Кстати, высказанные мною предположения об искусственности некоторых пиков полностью подтвердились. Вот
страница,
профиль и
сайт команды активистов, занимающейся этой раскруткой. А
вот страница подготовки первого твитер-шторма, тоже самое
тут + инструкции по настройке программы для автоматического твитинга. Таким образом можно с высокой долей уверенности предположить, что высокая доля англоязычных твитов является признаком исскуственного продвижения.
Теперь взглянем на самое вкусное, почасовой график количества твитов для каждого из трех основных языков:
Его можно разделить на две основных части по 27 февраля, дне, когда начали поступать сообщения о вторжении российских войск в Крым. До этого для графика характерно примерное совпадение количества украино- и русскоязычных твитов (с непонятными пиками 2 и 3 февраля еще предстоит разобраться), а также четкая взаимосвязь между количеством англоязычных твитов и напряженностью событий, что еще раз косвенно подтверждает искусственность их происхождения. Вторая часть графика характеризуется резким доминированием русского языка над украинским. Чтобы понять о чем же причина отличия двух частей графика, я подсчитал наиболее популярные твиты для 2 Марта, когда разрыв был особенно высок, результат получился вполне сравнимым с
распределением популярности твитов в часы пиковых вбросов, только растянутым в течении дня:
a russia-ukraine border web-camera. "thousands of refugees leaving ukraine", russian officials say via http: 401
ватников троллили еще в чехословакии. 406
ну вот уже насрали. где я - там россия. 407
полтава за единую украину. и против президентов страдающих мужским климаксом. 407
в плохом смысле. 467
ну и как это понимать? 487
" : такого никогда не было. призывники штурмуют военкоматы. и это не львов, это днепр ”" 494
спасибо свободным гражданам россии! 506
это уже символ свободы. 513
макс.репост! внимание! русские "организмы" на старте! 605
: never ever trust anything coming from media! h 1148
а вот как выглядят десятки тысяч украинцев, бегущих в россию. 1505
некие хештеги 4607
В целом из рассмотренных результатов можно сделать следующие выводы и предположения:
- ведется активная работа над позитивным имиджем евромайдана в твитере;
- в реалиях украинской политической борьбы значительная доля англоязычного контента означает организованный pr события;
- работу pr команды в твитере легче всего отслеживать по небольшому набору ключевых хештегов;
- для отслеживания перепитий Евромайдана в твитере достаточно собирать твиты только на русском языке, их репрезентативность вполне соответствует украиноязычному контенту, а иногда и превосходит его;
- после военной интервенции в Крым, возможно:
------твиттер-команда Евромайдана изменила методологию, отказавшись от кратковременных интенсивных вбросов и перейдя на растянутый во времени и отрегулированный по нормальному суточному циклу постинг. Или;
------к обсуждению событий подключилось большое количество жителей восточной части Украины, а жители запада сильно потеряли интерес. Это может косвенно свидетельствовать о том, что противостояние в Киеве сильно "трогало" украиноязычное население, а политический кризис в Крыму и инцинденты в Харькове, Донецке и т.д. оставляют их достаточно равнодушными (такой вот раскол).
Правда, касательно последней группы предположений, скорей всего имеет место определенное взаимоотношение двух факторов+что-то не учтенное.