В предыдущем
посте о средних зарплатах внимание многих привлёк факт, что количество плательщиков сильно разнится: даже для городов-миллионников примерно одинакового населения разница составляет более двух раз. Если присмотреться к цифрам ближе, то станет видно что, количество работающих выше в тех городах, которые: (А) имеют большую агломерацию и (Б) имеют хороший миграционный прирост.
Я попробовал сравнить разные корреляции с учётом этих факторов, и в итоге получил следующую функцию, которая описывает размер рабочей силы в городах. Итак:
(общее количество работников) = (население города)×0.47 + (население городов в радиусе 100 км)×0.04 + (миграционный прирост 2016-2019)×0.7.
С помощью такой функции удалось очень хорошо повысить качество корреляции с 0.74 до 0.87.
Коэффициенты подобраны перебором, но получились реалистичными.
1. Мы знаем, что в городах примерно 70% жителей трудоспособным, из них примерно 70% работают по найму, т.е. итоговая доля наёмных работников в населении должна быть около 49. Получилось 47%, ок.
2. В агломерации 4% населения работают методом маятниковой миграции. Тоже довольно реалистично.
3. Неучтённая миграция меньше, но имеет один порядок с учтённой, что тоже разумно.
Вряд ли можно получить ещё более высокую корреляцию из общих данных, т.к. в дело вступают уже местные особенности городов: доля серого рынка, структура экономики и населения, развитость агломерационных связей, профили миграции.
И также у меня появилось сомнение, а является ли Волгоград городом-миллионником? По цифрам он вровень с 800-тысяниками Саратовом и Тюменью, а ведь под боком у Волгограда есть ещё 300-тысячный Волжский.