Не фанат Тишкова, но в его защиту. Я так понимаю. что перепись требует заносить самоназвание. Раньше если оно не совпадало с перечнем, его вносили в "азер". А теперь "азер" разбили на категории часто встречающихся ошибочных самоназваний. А от них при обработке будут делать алиасы к "правильным" названиям. Как если бы Гугл выкупил все возможные неправильные написания доменного имени. Красивое решение, нет?
Это логично, если разным вариантам (являющимся синонимами) присвоен один классификационный код (пример из статьи -- язык жестов). А вот зачем обозначать "крымско-татарский" и "крымскотатарский" разными кодами -- не знаю (понятно, что слить потом в общую категорию элементарно, но зачем разделять на этапе сбора данных?) Единственная причина -- выяснить частоту различных самоназваний в одной и той же (с точки зрения науки) этнической группе. Условно, сколько из папуасов считают себя "папуасами хули". Но вряд ли это работает в случае разных написаний (дефисное и слитное) или разного порядка слов ("язык татар юртовских" и "язык юртовских татар"). Да и научно-практическая ценность такого исследования неочевидна. Но вдруг она всве же есть? В общем, с учетом масштабности труда осуждать разработчиков трудно.
Да, здесь было бы интересно услышать специалиста по теме. Можно предположить, что это связано с особенностями заполнения форм в предыдущие переписи, но тоже как-то слабо.
Comments 3
Reply
Reply
Reply
Leave a comment