Население России-2010 по родным языкам и группам

Oct 17, 2019 12:55

Решил в качестве тренировки перед будущими выкладками данных переписи-2020 потренироваться на предыдущей, 2010 года, а именно - сделать хоть сколько-то адекватным распределение населения по родным языкам. Главная проблема в том, что в разных случаях одни и те же ситуации попали в базу с разными уровнями детальности, см. прошлый пост по проблеме разграничения языков и диалектов. Скажем, есть два мордовских языка - эрзя и мокша, но в графе "родной язык" это деление обозначено лишь у небольшой части реально на них говорящих, у основной массы - просто "мордовский". Или пресловутый китайский, который по европейским меркам даже не подгруппа, а целая группа языков.

В общем, распределил фактические официальные цифры по двум уровням дробности - континуумы с 60-70% лексических совпадений базовых словарей (типичный пример - славянская группа языков) и с 80-85% (восточно-славянская подгруппа). Выяснял расстояния по куче источников в интернете. Конечно, эти континуумы и сами нечеткие, поэтому и оставлены такие диапазоны процентов. Грубо говоря, 70% и 85% - это предельные расстояния языков от крупнейшего монолитного куска в континууме, а 60% и 80% - между двумя не крупнейшими. Но есть исключения. Короче, очень и очень условно. Уровень 92-95%, то есть самостоятельные языки в привычном нам понимании, хотел сделать, но для этого не по всем языкам хватает данных, увы.


"Дагестанский язык" (в отличие от указанных отдельно аварского, кумыкского и др.) не учитывал - непонятно даже, к какой языковой семье это относится.

Распределение картинкой:

[Spoiler (click to open)]


Названия в некоторых случаях пришлось выдумывать, чтобы было более-менее последовательно. И стоит помнить, что в 20 тысячах носителей "других языков" есть микроязыки из обозначенных групп и подгрупп, которые вообще-то надо прибавить. Так что здесь приведены нижние оценки численности.

А теперь - сами списки крупнейших континуумов (более 8 тысяч человек):

По порогу 60-70% лексических совпадений

славянский 119195148
ц.-тюркский 8402850
вайнахский 1857794
чувашский 1027363
общеаварский 900146
армянский 829345
абхазо-адыгский 747370
общелезгинский 677831
даргинский 580752
пермский 545982
общемонгольский 537089
осетинский 493182
мордовский 486234
якутский 483985
марийский 414744
ц.-иранский 242954
цыганский 175890
лакский 172639
грузинский 102269
романский 99573
германский 60427
с.-самодийский 33385
корейский 31929
китайский 31161
ц.-финский 26130
греческий 23211
балтийский 16208
вьетский 14186
общетунгусский 14075
обско-угорский 13229
общечукотский 9949
аравийский 8573
с.-семитский 8436

По порогу 80-85% лексических совпадений

в.-славянский 119177958
кыпчакский 7114612
вайнахский 1857794
чувашский 1027363
аваро-андийский 880159
армянский 829345
адыгский 699069
ц.-огузский 632092
в.-лезгинский 627411
с.-даргинский 580752
с.-монгольский 537089
осетинский 493182
мордовский 486234
якутский 484574
марийский 414744
удмуртский 347970
саянский 261912
карлукский 246274
коми 198012
персидский 181957
цыганский 175890
лакский 172639
грузинский 102269
румынский 92675
горно-алтайский 66260
курдский 55947
хакасский 52813
ц.-германский 50739
абхазо-абазинский 48301
рутуло-цахурский 46373
с.-самодийский 33385
корейский 31929
с.-китайский 31161
туркменский 28887
ц.-финский 26130
греческий 23211
цезский 19987
вьет-мыонгский 14186
с.-тунгусский 11772
ю.-славянский 11604
хантыйский 11439
литовский 10795
общечукотский 9949
английский 9546
аравийский 8573

Итак, после понятного тотального доминирования русского языка с учетом родственных среди всех меньшинств не менее тотально доминирует тюрко-кыпчакское языковое пространство от татар-башкир-казахов-"половцев" (кумыки и карачаево-балкарцы) до киргизов и крымских татар, языки которых на данный момент находятся на стыке кыпчакской с другими подгруппами. Они могут понимать речь друг друга не хуже, чем коренные деревенские жители ВОлОгОдчины и Львівщини.

acer120, eleksein, jirzik, oleg_lisowski - если есть что сказать по поводу методики, пишите.

языки, перепись, Россия, население, ©

Previous post Next post
Up