Казалось бы, зачем этот пост? Рейтинг самых популярных языков мира - вообще не секрет, гуглится за секунду. Но дело в том, что гуглится сразу несколько рейтингов, которые друг другу противоречат, и все из-за нечеткости двух определений: "владение языком" и собственно сам "язык". Будем разбираться.
Во-первых, сразу нужно отделить носителей языка (нейтивы, другим словом) - те, для кого он родной, с той условностью, что для еще не говорящих детей во младенчестве он номинально определяется по языку родителей - от вообще владеющих языком, включая выучивших его впоследствии. В социолингвистике для первых и вторых используются термины L1 и L2. При этом L2 - понятие крайне неточное, определить уровень владения неродным языком - та еще проблема. И где проходит граница, что этот уровень уже учитывается, а тот еще нет - очень спорный вопрос. К тому же изучают люди в основном литературные языки, а разговаривают - представьте себе - на разговорных. И эти множества в целом сильно не совпадают.
Поэтому рассмотрим только носителей-нейтивов, L1. Причем оставим за скобками билингвизм (когда для человека являются родными два языка) - в целях упрощения в лингвостатистике такого обычно не допускают, кое-как разделяя. И дальше возникает знаменитая
проблема "язык или диалект". Понятие языка из чисто научного давно стало социальным, а впоследствии еще и политическим. Сложная история взаимоотношений стран, изменений их государственных границ, формирования наций из этносов, использования языков разными этносами и нациями привела к большой неразберихе. Нередки случаи, когда два языка считаются отдельными в одной стране и диалектами в другой.
И это даже не самое страшное - всюду разная дробность. В одних случаях для самоопределения носителями своего языка как самостоятельного достаточно минимальных отличий, обычно подкрепленных политическим статусом территории его распространения. В других - жители огромной территории идентифицируют себя как носителей одного и того же языка, но разных наречий - при том, что носители этих наречий с очень большим трудом понимают друг друга.
Для отделения мух от котлет в данном вопросе лингвисты используют термины
"диалектный континуум" и "языковой кластер". Как для диалектов и наречий, так и для близкородственных языков с определенными условностями можно определить степень их сходства - обычно для этого в компаративистике (сравнительно-исторической лингвистике) берется показатель лексического расстояния (см.
список Сводеша) - чем больше понятий обозначаются одинаковыми или хотя бы однокоренными словами, тем ближе. Если сравнить с наиболее знакомой нам генеалогической классификацией языков на примере индоевропейской семьи, то:
1) Диалектам одного языка, иногда имеющим статус разных языков соответствует лексическое расстояние более 95% (например, московские и поморско-архангельские говоры, румынский и молдавско-румынский);
2) Языкам одной подгруппы (иногда считающихся диалектами крупного языка) - более 85% (примерно таково расстояние, допустим, между русским языком Ярославля и украинским Винницы, либо португальским Порту и испано-каталанским "суржиком" Валенсии);
3) Языкам одной группы разных подгрупп - более 70% (русский и польский, английский и немецкий, испанский и французский и т.д.)
Если сравнить родные европейские языки с другими, откроется много интересного, для кого-то неожиданного. Арабский язык в вариациях от Марокко до Ирака - это фактическая подгруппа семитских языков, понимание между отдельными разговорными вариантами несколько затруднено (хотя литературные нормы сближены). Китайский язык - это даже не подгруппа, а группа: коренные жители Пекина, Шанхая и Гуанчжоу поймут друг друга ощутимо плохо, как испанец с французом и итальянцем. Спасает литературный язык (путунхуа) на основе пекинского наречия, который в обязательном порядке изучают в школах Китая, и письменность - они используют одни и те же иероглифы для одинаковых слов, хотя произносят их по-разному. В китайском макроязыке выделяется основной язык -
мандарин (или северокитайский), на котором говорят 3/4 от всех китайцев, но и это в наших терминах не язык, а целая подгруппа. Еще можно привести пример хиндустани - общего названия для множества вариаций индоарийских языков, главные из которых - хинди (само по себе неоднородное понятие) и урду. По лексическим отличиям это также подгруппа в европейском понимании.
Воспользовавшись данными
Ethnologue на 2019 год, параллельно сравнивая с некоторыми другими, составил три таблицы - соответственно топ-13 и два топ-11 языковых кластеров / диалектных континуумов: 70% (пример - славянский), 85% (восточнославянский), 95% (русский), естественно с округлениями - более точные данные получить затруднительно. Четыре крупнейших группы раскрашены для наглядности:
№
70%-континуум
Млн
1
Китайский
1300
2
Индоарийский
1250
3
Романский
850
4
Германский
525
5
Банту
400
6
Семитский
350
7
Славянский
275
8
Зондский
200
9
Тюркский
175
10
Ю.-дравидский
150
11
Иранский
125
Филиппинский
125
Японский
125
№
85%-континуум
Млн
1
Мандарин
920
2
Иберийский
690
3
Хиндустани
630
4
Английский
380
5
Арабский
320
6
Бенгальский
250
7
В.-славянский
190
8
Пенджабский
150
9
Японский
125
10
Огузский
110
Ц.-германский
110
№
95%-континуум
Млн
1
Испанский
460
2
Английский
380
3
Ю.З. мандарин
360
4
Ц. хинди
340
5
Бенгальский
250
Ц. мандарин
250
7
Португальский
220
8
Русский
150
9
С. мандарин
125
Японский
125
11
С.В. мандарин
110
Главный неожиданный вывод - на уровне языков в привычном нам понимании крупнейшим оказывается не какой-либо из вариантов китайского, а испанский, на котором говорит 2/5 обеих Америк. Затем - английский и только потом юго-западный вариант мандаринского, крупнейший среди всех. Арабский, пенджабский, огузский (турецко-азербайджанский), центрально-германский (немецко-нидерландский) 85%-континуумы распадаются на части, к каждой из которых относится менее 100 млн человек. То же касается зондского (малайско-яванского), банту (куча языков южной трети Африки) и некоторых других 70%-континуумов. Вьетский (с основной частью в виде вьетнамского языка) подбирается к этой планке.
UPD. Примечания: южные наречия китайского макроязыка (в частности, юэ/кантонское) и магрибские варианты арабского (северо-запад Африки) по-хорошему соответственно до 70% и до 85% с центральными диалектами не попадают, но все-таки оставлю в таблице как есть, делая поблажку за счет "крыши" в виде литературной нормы, которая с течением времени сближает разрозненные диалекты. Особенно с ростом урбанизации, проникновения СМИ и Интернета, понятно почему.
Русский занимает восьмую строчку, как и в википедийном списке, но отличия в том, что здесь его обгоняют две разновидности китайского, зато без арабского, даже египетская версия которого сильно не дотягивает до попадания в число крупнейших языков мира.
Тема поста может быть интересна
acer120,
massimoling_ru,
nikola_rus,
pachem,
oleg_lisowski и другим.
Также, если кто не видел, порекомендую материалы по теме языкознания -
Смещение языковых полюсов,
15 самых важных языков мира.