На Земле свыше 6000 живых языков, но более половины населения земли разговаривают лишь на 16-ти из них, а языков, по-настоящему важных для человечества, и того меньше. При этом важные - это, очевидно, те языки, с помощью которых общается большинство многоязычных пользователей социальных сетей, это языки на которые или с которых переведены книги, написаны статьи специальных и массовых изданий, тексты Википедии и Твиттера. Естественно, именно эти языки оказывают наибольшее влияние на происходящее в мире.
Для определения таких языков и их связей с другими языками исследовательская группа из МТИ (Массачусетский технологический институт) изучила 2,2 миллиона переводов печатных книг (согласно Индекса переводов ЮНЕСКО), опубликованных на более чем 1000 языках, выполненных в период с 1979 года по 2011 год; 550 миллионов твиттов 17 миллионами пользователей на 73 языках, и, чтобы построить сеть Википедии, они отслеживали изменения, выполненные редакторами на пяти языках, тщательно исключая ботов.
На основании этих исследований были построены три диаграммы: для бумажных переводов (книги, журналы и проч.), для твиттов и для Википедии. В целом, конечный результат был следующим:
Объединенный результат трех диаграмм
Увеличение На диаграмме
· одним цветом показана одна языковая семья, т.е. языки, произошедшие от одного общего предка, праязыка;
· толщина линий - показывает удельный вес связей, т.е. количество переводов с одного языка на другой;
· размер круга языка - пропорционален количеству людей, которые на этом языке говорят
А началось всё с того, что руководитель программы Microsoft, израильтянин, говорящий на иврите и английском, Шахар Ронен рассказывал своему консультанту Сезару Идальго (который сам тоже говорит на двух языках: испанском и английском) о книге, написанной на иврите, о существовании перевода которой на английский язык он не знал. Во время этой беседы он задумался над путями, по которым происходит межъязыковая передача информации, и можно ли создать диаграмму путей передачи информации и идей с одного языка на другой.
Ронен и соавторы из Массачусетского технологического института, Гарвардского университета, Северо-Восточного университета и Университета Экс-Марселя решили эту проблему, описав языковые связи на основе переводов книг, двуязычных Твиттеров и многоязычных правок Википедии.
Схема переводов книг отображает, сколько книг переведено на другие языки. Например, книга на иврите, переведенная с иврита на английский и немецкий языки, будет представлена линиями, указывающими с узла на иврите на узлы на английском и немецком языках. При этом, каждый перевод с одного языка на другой образует одну связь.
Как и следовало ожидать, языком с самым большим количеством связей (каналов передачи информации) стал английский, но он оказался не единственным центром притяжения. Меньшие по масштабу, но достаточно центральными оказались французский, немецкий и русский языки. Например, такой язык, как нидерландский, на котором говорят всего 27 млн человек, оказался непропорционально большим каналом, по сравнению, скажем, с таким языком, как арабский, который имеет колоссальные 530 млн носителей. Это потому, что сами голландцы очень многоязычны и много пользуются социальными сетями интернета.
Также бросается в глаза отсутствие среди лидирующей группы таких языков, как китайский и хинди, то есть большое число носителей языка ещё не означает его влиятельность. Действительно, ценных для мировой культуры и науки произведений и работ на этих языках не так много.
Диаграммы по трем показателям: книги, твиттер и Википедия
Увеличение См.
Количество просмотров страницы в Википедии по странам