Об округленных данных

Nov 12, 2022 19:24

В ряде постсоветских стран - а скорее всего и не только в них - данные текущего учета о населении городов и административных единиц публикуют (или публиковали ранее) с точностью до 0,1 тыс. человек. Ну то есть 100 человек, просто обычно пишут в тысячах.

См. таблицы на http://pop-stat.mashke.org/ или на http://citypopulation.de/

При этом, как легко убедиться, сумма округленных значений для низших территориальных единиц всегда сходится с заявляемым значением для высшей (по районам - с областью, по областям - со страной, грубо говоря).

Что говорит о том, что квант учета - это именно 100 человек, потому что в общем случае сумма округленных слагаемых с определенной ненулевой вероятностью должна отклоняться от округления их суммы. Например, 130+130=260: если сначала суммировать исходные точные значения, а потом всё округлить, получится 100+100=300. И чем больше слагаемых, тем шире разброс отклонений, и соответственно меньше вероятность совпадения (когда минусовые и плюсовые отбрасываемые остатки взаимно гасятся).

Так что когда видите данные с округлением до 0,1 тысячи, имейте в виду - это не из соображений конфиденциальности или чего-то еще, учет изначально идет сотнями, а не единицами. Такое же может быть и не только в данных о населении, а например при публикации значений валового продукта.

(И, конечно, на том же принципе устроена простейшая проверка на фальсификации голосований - если суммы процентов по кандидатам равны 100,0% в каждом регионе, скорее всего их нарисовали, потому что при честном подсчете практически гарантированно появился бы разброс: 99,9%, 100,2% и т.д., 100,0% возникало бы лишь в части регионов, случайным образом).

[ЦА]barouh, ffinoz, kireev, spamsink, timbes5 и другие

числа, занимательные бредни, население, выборы

Previous post Next post
Up