Я тут взялся за старое и стал теребить твиттОр на более регулярной и научной основе. Первым плодом стал
twistr.ru -- штучка, которую мы запилили с друзьями по итогам пары встреч за пивом и разговоров за Data Science. Её смысл, думаю, очевиден: она мониторит упоминания интересующих людей и событий в твиттОре в режиме реального времени. Пока что там по умолчанию мониторятся упоминания В.В. Путина JUST BECAUSE.
Поковыряться в данных я пока не успел, но пара любопытных наблюдений уже есть. На следующих картинках представлены графики потока во время Послания Президента Федеральному Собранию 4.12.2014 и Пресс-Конференции В.В. Путина 18.12.2014 соответственно:
Не вдаваясь в технические подробности и цифры, на обеих картинках можно визуально ухватить разницу между двумя событиями. Послание Федеральному Собранию выглядит как Ядерный Гриб и просто напрашивается на описание с помощью "бомбануло" и "пукан". Впрочем, у разных людей были разные образы, самый невинный из которых -- "медуза". Вариант, предложенный
mad_differens я не буду упоминать из соображений приличия.
Вторая же картинка больше похожа на... сперматозоид, по мнению одного из коллег в ФБ.
С чем это связано -- я не знаю, поэтому вопрос остаётся открытым.
В качестве бонуса -- общая картина упоминаний во время Послания Федеральному Собранию.
Размером указана частота слов, цветом -- темы, в которых они были использованы. Темы сгенерированы автоматически на основе новомодного Latent Dirichlet Allocation (LDA). Что это такое я до сих пор понимаю весьма поверхностно, зато точно знает
kilex . На графике потока те же темы отображены в виде оттенков "волн", но пока что совпадение цветов с теми, что на облаке тегов у нас ещё не сделано.
P.S. Написав пост, понял, что ответ, в общем-то, банален: "Послание" длилось 1,5 часа, а "Пресс-Конференция" 3 часа. Но пост уже написан, так что пусть висит хотя бы в качестве могильного камня моих познаний и интересов в политологии.