Языковой анализ музыкальных предпочтений

Jul 01, 2023 12:00


Для меня построение карт никогда не было оторвано от статистики. Карты я всегда любил и буду, но в целом мне нравились не прямо они, а графическое отображение тех или иных данных. Это может быть и карта, и пирамида, диаграмма, график.

В тоже время, у меня особые отношения с музыкой. Не описать словами её важность в моей жизни. Когда её нет, она зачастую играет у меня в голове сама, как бы безумно это не звучало.

В какой-то момент, две эти вещи слились в одну. Данный пост, хоть и будет персональным, будет базироваться на двух важных критериях: обособленность от личных предпочтений и от конкретных исполнителей. Не хочется, чтобы создавалось впечатление саморефлексии или пиаре конкретных артистов. Тут будет рассмотрено два анализа, временной и частотный. В крайнем случае, это может хотя бы послужить пособием тем, кто хотел бы проанализировать свои музыкальные предпочтения, но не размышлял как.

Временной анализ.

Итак, что же имеется ввиду? У вас есть список песен, которые вы добавили себе в любое из устройств прослушивания. Чаще всего сегодня это музыкальные сервисы, вроде Spotify, Яндекс Музыка, Youtube Music и т.д. С ними проще, т.к. приложение можно установить на любое устройство. Если вы слушаете музыку не через музсервис, а путём прямой закачки, данный анализ теряет актуальность, если прослушивание производится и через другие устройства, куда вы музыку уже могли бы и не закачать (радио, магнитола и т.д.).



В моём случае, это Spotify. Заведён он был в 2020 году и таким образом, анализ будет проведён на базе прошедших как раз ровно 2,5 лет, благо он хранит в себе память, в какой день была добавлена песня. Как же можно структурировать песни? Стилистически - сложно. Стили имеют множество ответвлений, находящихся между собой или вовсе за гранью определения жанра. Есть более простой способ - языковой.

Подводным камнем является только то, что не все песни исполняются на одном языке. Как тогда быть? Я принял довольно простое решение. Если песня имеет английские или русские фразы/строки, помимо наличия другого языка - песня идёт в список именно того языка, поскольку иначе придётся заниматься вычислением строк (или до безумия, слов) и от этого лишь заболит голова. Потому вычисления были лишь в редких случаях, когда смешение произошло без английского и русского языков. Ещё раз, кратко, русские смешанные и английские смешанные - к смешанным, смешанные без них - в базу тех, доля чьего языка больше.

Собрав всё, что было накоплено до 2020 года включительно, получилось что то вроде этого:



То, что доли расположены неравномерно (не по крупности) связано с конечным результатом - всё по итогу встанет на свои места. Сбор занял длительное время, но довольно фиксировано, ибо у меня также есть языковые плейлисты в Spotify. Треков много, потому что много памяти и большое желание иметь всё при себе, от только понравившегося до ностальгии по тому, что слушал очень давно. На 2020 год я уже старался расширять свои горизонты, это заметно просто по количеству языков, т.к. большинство людей останавливаются на двух-трёх языках. Два, если родной язык хорошо распространён в мире, три, если есть язык влияния (Франция - французский и английский, Казахстан - казахский, русский, английский).



На 2021 год виден большой перекос в азиатскую сторону, в первую очередь в корейскую музыку. Собственно, на конец 2020 года началось активное увлечение песнями на корейском, японском. Почти все условно непопулярные языки станут появляться позднее. В тоже время, доля русских песен сопоставима с корейскими и английскими.



На основании трёх лет уже можно отслеживать определённую динамику. Я специально отметил численность добавленных, т.к. единичные языки/песни из-за большого обилия тех и других сложно отличить. Корейские треки заняли уверенное большинство, заметно возросла доля треков на японском. 2023 год перешагнул экватор.



Не думая даже заранее о создании такого поста, я вёл статистику и по полугодиям. Там более ярко видно и изменение в пользу песен на том или ином языке, а также отсутствие постоянства, которое по идее видно здесь. Нет, не всегда один язык имел одинаковое преимущество над остальными, это же творчество, а не пятилетний план. Без чисел, по полугодиям это выглядит так.



Теперь всё выглядит не так прямолинейно. Видно, что каждый язык из "большой тройки" в своё время имел относительное большинство, при этом английский язык имея большинство по 2021 году, не имеет его нигде по полугодиям. Деревянное четвёртое место не всегда было японским, но и испанским.



Итог же выглядит таким. Пары лет, на первый взгляд, недостаточно чтобы сместить традиционные языки прослушивания. Однако заметна общая динамика - снижение доли английского языка. При продолжении тенденции, он не перестанет языком №1, но абсолютного большинства иметь не будет. На фоне снижения доли англоязычных песен даже подросла доля русскоязычных, пусть и немного. Инструментал, добавленный до обозреваемого периода продолжает быть четвёртым с большим отрывом.

Можно также, как я это люблю иногда делать с картами, взглянуть на итог, собрав языки в семьи. Существенно при этом картина свой вид не поменяет, но почему нет?



Всё это именно тенденция последних 2,5 лет, что можно увидеть на гистограмме по доле добавленных треков на одном и том же языке в этот период от общего количества.



Те языки, у которых 100% не удивляют, их всего пару штук и зачастую это обусловлено увлечением конкретным исполнителем. Но в случае с большими количествами это уже не работает. Более 90% японских треков, более 70% треков на корейском и украинском языках были добавлены после 2020 года, места 1,2 и 4 же идут наоборот (английский 13%, русский 30%, инструментал 15%). Контекст времени может и влиял на доли, но не сильно. По полугодиям среднее количество добавленных новых песен варьируется от 101 до 159.

Подобный результат обусловлен порогом вхождения. Звание "меломан" зачастую очень испорчено людьми, называющими себя таковыми. Карикатурный меломан говоря о роке или металле зачастую далеко не уходит от Нирваны или Металлики, инструментал ограничен блюзом или классикой. У меня порог низкий, и в моём восприятии я действительно меломан, поскольку и дэткор и кпоп, и панк и условный Тимур Муцураев у меня добавлены друг за другом по ходу открытия очередной работы, которая с той или иной силой берёт за душу. Языковое разнообразие является следствием этого, а не наоборот. И я надеюсь продолжать расширять эти горизонты дальше.

Частотный анализ

Хорошо, анализ добавленных работ по языку безусловно говорит многое о примерной базе и диапазоне слушателя. Но ведь добавленная единица единице рознь, мы не слушаем всё что у нас есть с одной периодичностью. Именно для этого, необходимо оценить частоту прослушивания конкретной песни или исполнителя за определённый момент времени.

В данном случае может помочь сервис Last.fm. К нему подключается используемый музсервис и содержит целую плеяду данных. К сожалению, о Lastе я узнал чуть менее года назад, соответственно проанализировать могу только данный период, сервис не знает, что и сколько вы слушали до подключения.

Итак, что конкретно можно узнать? Да всё:

  • последние прослушанные треки в строгой очерёдности;
  • наиболее прослушиваемые артисты;
  • наиболее прослушиваемые альбомы;
  • наиболее прослушиваемые треки.

При этом, всё это можно проанализировать не только за весь период с момента авторизации, но и за неделю, месяц, сезон, полугодие, год, очень удобно. Первый из четырёх параметров нас не интересует, а временной отрезок возьмём с момента регистрации (примерно 10 месяцев).



Первые места по исполнителям занимает тяжёлая англоязычная музыка. У них есть преимущество, которое постоянно будет приращивать количество прослушиваний - я под это бегаю. Дальше идёт прерываясь на метлу куча женских кпоп групп, являющихся локомотивом того, что я добавлял последние годы. А после Сектора Газа всё идёт смешанно, но кроме Шакиры и инструментальных групп всё тоже самое. Исполнителей на русском или на японском в топе 20 не оказалось, что обусловлено и поляризацией исполнителей, и действительно более низкой частотой прослушивания.



Уже по альбомам видно большое несоответствие с предыдущим списком. Первое место занимает альбом BlackPink, кпоп. Но по коллективам, три релиза Le Sserafim, тоже кпоп, обгоняют первое место почти в два раза. Появляются русскоязычные исполнители, причём в случае с Согдианой, это ностальгия по двум песням, заслушанным до дыр, если бы было что дырявить. В остальном, те же исполнители.



На песнях поляризация очевидно усиливается. Появляются исполнители одного трека (не хита, а именно того, что зацепило меня и не развило общий интерес к исполнителю). Тут появляется и монгольский трек от The HU и только здесь проявилось что-то на японском от Aimer.

Это всё уже само по себе может быть интересно как статистика. Но и для анализа по тем же языкам это применимо, но с доп оговоркой, что всё таки некоторые исполнители имеют треки на иных языках (например, кпоп исполнители в большинстве случаев имеют треки на японском или английском). Да и куда девать Шакиру? (в испанский)

Поэтому это будет обобщённо.



По итогу, корейский язык является основным по всем аспектам. Русский, идущий третьим, по крайней мере в обозреваемый период большой популярностью не пользуется, хотя я ожидал куда более высокую планку.

Как я и говорил, на создание данного поста меня сподвигло слияние двух интересов: музыки и статистики. Но посыл несколько шире. Анализировать можно всё, было бы желание и возможности. Например, Кинопоиск обладает достаточно большой базой по статистике оценённых фильмов, от средней оценки по жанрам до рейтинга съёмочного состава всех мастей, сформированного по оценке фильмов. Раннее там даже была география съёмки фильмов, которую к сожалению убрали. Опять же, можно сделать языковой анализ на основании языка киноленты. Можно пойти ещё дальше и в музыке, и в кино, занявшись этносоставом, но это не моё и имеет более проблемные подводные камни.

Напоследок, я нашёл ещё один способ анализа музыки - музфестивали. Подходит он далеко не всем, главным обзором здесь являются мероприятия с выступающими из разных мест, которые борются за награду. В моём случае, такой только один - Евровидение. Его я смотрю регулярно почти 12 лет с перерывом на 2013 год (хотя отдельные треки есть и с конкурсов других лет). Набросал, опираясь на Spotify всё, что у меня есть и получилось примерно так.



Что можно проанализировать по Евровидению? Ну, снова язык, только не по конкретному языку, а по исполнению свой/не свой. Розовым отмечено исполнение на языке государства (опять же, берём в оборот смешанные треки). Оранжевым отмечены случаи исполнения не на языке государства, но и не на английском. Голубым - работы, просто не прошедшие в финал.

Итого 75 работ и лишь треть из них на языке государства. Надо понимать, что вроде как до 1999 года исполнение на государственном языке было обязательно. После снятия правила многие перешли на английский. Например, Латвия выступает с 2000 года и имеет только одну песню на латышском, две - на латышском и английском. В то же время, Сербия наоборот имеет только три английские песни и три смешанные, остальные все на сербском.

Во временном отрезке самым продуктивным лично для меня оказался внезапно оказался 2023 год. Возможно, это обусловлено снижением того самого "порога вхождения". Не знаю.

Надеюсь вам понравилась статья. Отслеживать выход статей легче в моём телеграм-канале, в котором всегда будет прямая ссылка на полную версию. Из-за множества площадок публикации контента, отвечаю на вопросы в основном там.

Благодарю Михаила Балабана, Ильяса Мусина, jirzika и Дмитрия Щербакова за поддержку на бусти. Увидеть оригиналы работ, отдельные замечания и многое другое, а также просто поддержать меня, можно с помощью подписки на сервисе бусти.

Спасибо

ИМХО

Previous post Next post
Up