Хоть оценку населения каждого квадрата в километровой сетки, наложенной на карту Екатеринбурга, проводил исходя из границ избирательных участков, а не местам расположения УИК (стандартная ситуация в больших городах - 3-4 УИК в одной школе), ошибки в оценке населения могут быть существенные. Тут френды предлагают модели сглаживания исходя из учёта в той или иной пропорции населения 8 смежных к одной ячейке квадратов. Подобный метод будет. Насколько понял, barouh брал каждый квадрат по 1/9 в доле. doncunita предложил по 1/4 в центр, 1/8 по смежным по горизонталям и вертикалям (сумма 1/2), и 1/16 по диагоналям (сумма 1/4).
Решил подойти к определению долей с помощью теории вероятностей. Постараюсь популярно изложить, рисовать теорию лень, тем более сам в ней не разбираюсь )) (если что, поправьте мои измышления пжл). Берем сетку квадратов 3 на 3. Смотрим, как можно сместить центральный квадрат, чтобы он содержал в себе изначальную центральную точку. Ясно, что в пределе он может занимать половину верхнего (нижнего, левого, правого) квадрата и только четверть углового. Смотри вероятности включения той или иной точки квадратов 3 на 3 в смещенный центральный квадрат. Центральная точка - 100%, точки в центрах ребер центрального квадрата - 50%, точки по углам центрального квадрата - 25%, точки в центрах остальных квадратов - по 0% (от них при приближении к центру вероятность перестает быть нулевой). Заметим, что вероятность определяется высотой пирамиды с основаниями (=0) в угловых квадратах и вершиной (=1) в центральном квадрате. Интенсивность учета характеристик квадрата (точнее - населения) определяется объемом, который он отсекает от пирамиды. Получаем, что все население углового квадрата в среднем должно быть учтено в 1/64 случаев, смежного по стороне с центральным квадратом - в 6 раз больше, т.е. в 3/32 случаев, а центрального - еще в 6 раз больше, т.е. в 9/16 случаев. Осталось внести поправки для предельных случаев по краям выбранной карты. Тогда есть предложение увеличить долю населения центрального квадрата на доли выпадающих квадратов за пределами карты. Если квадрат находится с краю карты, но не в углу, доля его населения составит уже 11/16, а ели он угловой - то 13/16.
В итоге получается такая красотень, чем-то напоминает карты засветки:
Коричневые квадраты - плотность населения 7500 чел. / кв.км и более; Красные квадраты - плотность населения от 1500 до 7500 чел. / кв.км; Оранжевые квадраты - плотность населения от 300 до 1500 чел. / кв.км; Зеленые квадраты - плотность населения менее 300 чел. / кв.км; Розовый цвет - ячейки, добавляемые к городскому центру по итерационному правилу (если 5 и более соседних клеток уже входят в один городской центр); Темно-оранжевый - ячейки с высокой плтностью (от 1500 до 5000 чел. на кв.км), не образующие городских кластеров, по факту приравниваемые к ячейкам оранжевого цвета.
Теперь еще об одном методе борьбы с выбором начальной точки сетки, который взбрёл мне в голову. Чтобы модель была устойчивой, надо бы ее проверить на других предельных случаях. По идее, надо еще сместить сетку на полклетки вправо, или на полклетки вниз, или и вправо и вниз. И если хотя бы в одном случае ближайшие друг к другу городские центры или кластеры объединяются, то меньший из них не выделять в самостоятельный кластер или центр. Но это связано с трехкратной переоценкой распределения населения по квадратам, что трудозатратно. Но если объединить 4 ячейки в квадраты со стороной 2 км и оценить в таких квадратах среднюю плотность, то такой анализ можно провести "не отходя от кассы". Всего получается 4 случая: [Spoiler (click to open)]
В последнем случае видим, что Химмаш благополучно объединился с центральной частью Екатеринбурга в один городской центр. Скажу сразу, на предварительном этапе по километровым квадратам у меня так и выходило, и если бы сместил сетку немного влево - то точно. В то же время, Кольцово, Компрессорный, Берёзовский, Новоберёзовский, Верхняя Пышма и Среднеуральск остались самостоятельными урбан-центрами (кластерами) во всех случаях.
И вот здесь приходим к необходимости адаптации европейской методики к методике широкого применения - по разрывам в застройке вдоль автодорог. Я урбан-ареалы оценивал ранее по критерию суммарных разрывов вдоль автодорог в 5 км. Но ещё ранее был критерий единичного разыва в 5 км (для любых разрывов, без ограничений) и суммарных в 7 км.
В США, Австралии, Канаде процесс формирования урбан-ареалов 2-этапный. Сначала формируют блоки с повышенной плотностью (не менее 400 чел./кв.км в Канаде и Австралии и 1000 чел./кв.милю или 386 кв./км в США и присоединяя к ним смежные кварталы с плотностью населения не менее половины от величины минимально допустимой плотности населения. А затем объединяются УА, расстояние между границами которых составляет менее 2 км по дорогам в Канаде, менее 1,5 км в Австралии и менее 0,5 мили (0,8 км) в США. При этом делается исключение для следующих дорог: мосты, гидротехнические сооружения, а также дороги, к которым хотя бы с одной стороны примыкают территории, которые не могут быть использованы для строительства зданий и сооружений (городские парки, кладбища, стадионы, аэродромы, автостоянки, АЗС, жд станции и т.д.). Но в США дополнительно установлено ограничение по максимальному разрыву для таких дорог - не более 6 миль (9,7 км), чтобы Окленд "пролазил" в УА Сан-Франциско и применяется ограничение по предельной сумме разрывов в застройке по дорогам, которые не могут превышать 4 мили (около 6,4 км) - хотя бы по одной из пяти основных дорог, рассчитываемые от урбан-ареала численностью свыше 50 тысяч жителей. Вот раньше основной свой подобный критерий там не находил. Ну и в конце границы УА выравниваются.
Поэтому, наряду с критерием суммарных разрывов в застройке по 5 км есть мысль применить и критерий единичных разрывов в 2 км, как в Канаде. И, при этом, расширить список ограничений, включив в него еще мосты. Тогда Химаш включится в Екатеринбург и по автодорогам. Включатся также все вышеперечисленные городские центры и кластеры. Насчет Среднеуральска только не уверен, посмотрю еще.