В
предыдущем посте я описал схему восстановления данных для обычных участков, связанных с оттоком с них избирателей на дэг. Эта схема безжалостна к волеизъявлению дэгенерировавших избирателей (если таковое вообще имело место). Восстановленные данные выполняют контрольные соотношения для каждого отдельного участка (т.е. каждый избиратель, принявший участие в выборах, что-то таки сделал со своим бюллетенем), но не являются согласованными для субъекта в целом (суммы по участкам сохраняются только для количества зарегистрированных и принявших участие в выборах избирателей, но не для количества избирателей, сделавших определённый выбор).
Здесь предлагается альтернативная (в чём-то даже ортогональная) схема. Восстановленные по ней данные нарушают контрольные соотношения для каждого отдельного участка, но являются согласованными для субъекта в целом. Кроме того, эта схема, наоборот полностью учитывает волеизъявление дэгенериратов. Думаю, что для анализа диаграммы рассеяния однозначно лучше именно эта схема, а про метод Шпилькина я пока не понял.
Все обозначения из
прошлого поста сохраняются. Формулы для восстановления параметров явки - тоже: размер участка wi′ = wi·(1+w/W), количество абстинентов hi′ = hi·(1+h/H) и участие в выборах ci′ = wi′ − hi′. Если xi избирателей на участке i сделали некоторый выбор (унесли домой или испортили бюллетень либо поддержали им конкретного кандидата). Тогда восстановленное значение xi′ = wi′ − (wi−xi)·(1+(w−x)/(W−X)), где по аналогии с предыдущим X = ∑i=1n xi и x - количества таких избирателей на всех обычных участках и едином участке дэг соответственно. Как легко понять, теперь к 1 теперь с единым коэффициентом сжимается не только общая явка, но и явка за каждый вариант выбора.