Решил в качестве тренировки перед будущими выкладками данных переписи-2020 потренироваться на предыдущей, 2010 года, а именно - сделать хоть сколько-то адекватным распределение населения по родным языкам. Главная проблема в том, что в разных случаях одни и те же ситуации попали в базу с разными уровнями детальности, см. прошлый пост по проблеме разграничения языков и диалектов. Скажем, есть два мордовских языка - эрзя и мокша, но в графе "родной язык" это деление обозначено лишь у небольшой части реально на них говорящих, у основной массы - просто "мордовский". Или пресловутый китайский, который по европейским меркам даже не подгруппа, а целая группа языков.
В общем, распределил фактические официальные цифры по двум уровням дробности - континуумы с 60-70% лексических совпадений базовых словарей (типичный пример - славянская группа языков) и с 80-85% (восточно-славянская подгруппа). Выяснял расстояния по куче источников в интернете. Конечно, эти континуумы и сами нечеткие, поэтому и оставлены такие диапазоны процентов. Грубо говоря, 70% и 85% - это предельные расстояния языков от крупнейшего монолитного куска в континууме, а 60% и 80% - между двумя не крупнейшими. Но есть исключения. Короче, очень и очень условно. Уровень 92-95%, то есть самостоятельные языки в привычном нам понимании, хотел сделать, но для этого не по всем языкам хватает данных, увы.
"Дагестанский язык" (в отличие от указанных отдельно аварского, кумыкского и др.) не учитывал - непонятно даже, к какой языковой семье это относится.
Названия в некоторых случаях пришлось выдумывать, чтобы было более-менее последовательно. И стоит помнить, что в 20 тысячах носителей "других языков" есть микроязыки из обозначенных групп и подгрупп, которые вообще-то надо прибавить. Так что здесь приведены нижние оценки численности.
А теперь - сами списки крупнейших континуумов (более 8 тысяч человек):
Итак, после понятного тотального доминирования русского языка с учетом родственных среди всех меньшинств не менее тотально доминирует тюрко-кыпчакское языковое пространство от татар-башкир-казахов-"половцев" (кумыки и карачаево-балкарцы) до киргизов и крымских татар, языки которых на данный момент находятся на стыке кыпчакской с другими подгруппами. Они могут понимать речь друг друга не хуже, чем коренные деревенские жители ВОлОгОдчины и Львівщини.