Так а в чем именно вопрос? Ясно, что методики учета Оперштаба и Росстата разные. Умышленно или неумышленно, насколько разные по регионам - это отдельный вопрос. Но тут нужен человек, который хорошо знает механику системы изнутри, чтобы в этом разобраться.
Объективно методика Росстата кажется более точной, но и она, похоже, сильно недоучитывает.
Вообще как точно считать никто не знает, нигде в мире.
При хорошей диагностике заболеваемости неплохо работала простая схема "все смерти в течение 30 суток после диагноза ковид, записываем в ковид". Как в Дании или Британии делали, например. Но этот метод завышает показатели примерно на уровень естественной месячной смертности в популяции или когорте, что тоже потенциально может заметно искажать результат. Например, в среднем по популяции это величина порядка 0.1%. Но по отдельным когортам это может сильно искажать картину. Скажем, в когорте 80+ естественная смертность за месяц может быть гораздо выше, порядка процентов. И если в этой когорте по такой методике считать смертность от насморка, она тоже получится несколько процентов.
Вполне может быть, что избыточная смертность так и остается самой надежной оценкой. При всей ненадежности бейслайна, экстраполированного уже на три года вперед.
Тут много вопросов, хотя по большому счету я с вашим мнением согласен. Но хочется общедоступной ясности (что за методики) и на этой базе сопоставимости данных Оперштаба и Росстата.
У этих данных прежде всего разные цели, насколько я это понимаю. Росстат не может дать оперативных данных, необходимых для оценки текущей ситуации и краткосрочного прогноза.
Данные Росстата (прямые и производные, типа избыточной смертности) относятся к Генеральной совокупности (все население региона). Данные Оперштаба - к некой выборке (например, "прошедшие тестирование на такую-то дату" = "Выявленные"). Ясно, что поголовное ежедневное тестирование невозможно, поэтому многое зависит от того, кто и когда попадает на тестирование.
Если бы Оперштаб учитывал события только в данной выборке, то сдавшие повторный отрицательный тест попадали бы в "выздоровевшие", а умершие за какой-то период наблюдения (допустим, те же 30 суток) - в "умершие". Попавшие в больницу из этой же выборки - "Госпитализированные" могут дать дополнительную информацию по потребности в больничных койках, а смерти в выборке "Госпитализированные" - представление об эффнктивности лечения этих тяжелых случаев.
Кроме того, сумма "выздоровевших" и "умерших" дает количество текущих "Исходов", что позволяет вычитанием их из "Выявленных" дает число текущих "Активных" (не обязательно равно понятию "Заразные", но ИМХО сильно коррелировано с ними).
Про расстрелы за очковтирательство и подтасовку данных я уже и не говорю, но Методика Оперштаба должна быть ясная, понятная всем и единая для всех. Тогда, имея еще и данные по количеству тестов на каждые сутки по каждому региону, можно делать выводы о соотношении процессов в выборке с процессами в генеральной совокупности. А это и даст возможность сопоставить цифры Росстата и Оперштаба и оценить ситуацию глобально.
//Росстат не может дать оперативных данных, необходимых для оценки текущей ситуации и краткосрочного прогноза.// почему нет? люди-в-теме вроде говорят, что статистика доступна ДСП на daily basis. Там, конечно, есть задержка, пока данные из моргов дойдут до ЗАГСов, но не очень большая, типа нескольких дней.
//При всей ненадежности бейслайна, экстраполированного уже на три года вперед.// во-первых, на два. во-вторых, вот сейчас отличная возможность проверить предсказания. в-третьих, уже можно сделать не экстраполяцию, и интерполяцию, и пересчитать результат. Я все надеюсь, что Дима это таки сделает - хотя кому это (кроме нескольких фриков) нонче интересно.
Слушай, я так и не ответил на твое письмо об этом - давай отвечу здесь. Может, in_kant что-то добавит.
> 1. Когда ты вычислял baseline для смертности по РФ, ты использовал экстраполяцию тренда. Многие (и я в том числе) говорили, что это опасное упражнение. Теперь можно проверить, насколько экстраполяция была обоснованной (спойлер: по-моему, вполне). Насмотря на то, что проверка делается задним числом, это, по-моему, очень важная проверка, валидирующая одно из самых сильный предположений в модели.
Не очень плнимаю - а как теперь можно это проверить? Эпидемия же еще не закончилась. Ты имеешь в виду, что когда все уляжется, то кривая смертности должна выйти на предсказанную экстраполяцию?
По России сырые данные выглядят так:
Что тут скажешь? Во-первых, линейная экстраполяция дает не очень сильный эффект, сравни три черные линии внизу. Во-вторых, реальная смертность летом 2022 (оранжевая) колебалась где-то вокруг, в июле даже упала ниже прогноза-2022. Но потом опять пошла вверх. Мне кажется, тут трудно в данных увидеть, была обоснованной экстраполяция или нет.
> Ты использовал одну и ту же baseline для обоих ковид-сезонов. Теперь можно ее еще точнее скорректировать (да хоть и по месяцам), что, насколько я понимаю, приведет к некоторому увеличению изб.смер. Насколько это важно, черт его знает, но было бы более аккуратненько.
В анализе по регионам России я делаю экстраполяцию на 2020, а потом использую тот же бейзлайн в 2021 и 2022. Так исторически сложилось. Но в анализе по странам мира я всегда экстраполирую тренд дальше, на 2020/21/22, т.е. в каждом году свой бейзлайн. На картинке приведенной выше как раз показаны эти три бейзлайна.
//тут трудно в данных увидеть, была обоснованной экстраполяция или нет.// ну, значит надо еще подождать. Хотя тенденция понятна, да. Но вдруг еще что-то попадется, из совсем недавнего...
Но все-таки я настаиваю: на три года. Время быстро летит - но последний доковидный год был 2019. И обычно мы тут экстраполируем, например, тренд 2015-2019. Бейслайн на 2020 - это экстраполяция на год вперед, 2021 - на два года вперед, а нынче уже 2022 заканчивается...
Ясно, что методики учета Оперштаба и Росстата разные. Умышленно или неумышленно, насколько разные по регионам - это отдельный вопрос. Но тут нужен человек, который хорошо знает механику системы изнутри, чтобы в этом разобраться.
Объективно методика Росстата кажется более точной, но и она, похоже, сильно недоучитывает.
Вообще как точно считать никто не знает, нигде в мире.
При хорошей диагностике заболеваемости неплохо работала простая схема "все смерти в течение 30 суток после диагноза ковид, записываем в ковид". Как в Дании или Британии делали, например. Но этот метод завышает показатели примерно на уровень естественной месячной смертности в популяции или когорте, что тоже потенциально может заметно искажать результат.
Например, в среднем по популяции это величина порядка 0.1%.
Но по отдельным когортам это может сильно искажать картину. Скажем, в когорте 80+ естественная смертность за месяц может быть гораздо выше, порядка процентов. И если в этой когорте по такой методике считать смертность от насморка, она тоже получится несколько процентов.
Вполне может быть, что избыточная смертность так и остается самой надежной оценкой. При всей ненадежности бейслайна, экстраполированного уже на три года вперед.
Reply
У этих данных прежде всего разные цели, насколько я это понимаю.
Росстат не может дать оперативных данных, необходимых для оценки текущей ситуации и краткосрочного прогноза.
Данные Росстата (прямые и производные, типа избыточной смертности) относятся к Генеральной совокупности (все население региона).
Данные Оперштаба - к некой выборке (например, "прошедшие тестирование на такую-то дату" = "Выявленные"). Ясно, что поголовное ежедневное тестирование невозможно, поэтому многое зависит от того, кто и когда попадает на тестирование.
Если бы Оперштаб учитывал события только в данной выборке, то сдавшие повторный отрицательный тест попадали бы в "выздоровевшие", а умершие за какой-то период наблюдения (допустим, те же 30 суток) - в "умершие". Попавшие в больницу из этой же выборки - "Госпитализированные" могут дать дополнительную информацию по потребности в больничных койках, а
смерти в выборке "Госпитализированные" - представление об эффнктивности лечения этих тяжелых случаев.
Кроме того, сумма "выздоровевших" и "умерших" дает количество текущих "Исходов", что позволяет вычитанием их из "Выявленных" дает число текущих "Активных" (не обязательно равно понятию "Заразные", но ИМХО сильно коррелировано с ними).
Про расстрелы за очковтирательство и подтасовку данных я уже и не говорю, но Методика Оперштаба должна быть ясная, понятная всем и единая для всех. Тогда, имея еще и данные по количеству тестов на каждые сутки по каждому региону, можно делать выводы о соотношении процессов в выборке с процессами в генеральной совокупности. А это и даст возможность сопоставить цифры Росстата и Оперштаба и оценить ситуацию глобально.
Reply
почему нет? люди-в-теме вроде говорят, что статистика доступна ДСП на daily basis. Там, конечно, есть задержка, пока данные из моргов дойдут до ЗАГСов, но не очень большая, типа нескольких дней.
Reply
Но то, что у "товарища майора" есть более лучшие данные - интересно.
Reply
По-моему, он ее просто из головы выдумывал.
Reply
но есть возражения:
https://termometr.livejournal.com/1104507.html?view=comments#comments
Reply
Reply
Reply
Reply
во-первых, на два.
во-вторых, вот сейчас отличная возможность проверить предсказания.
в-третьих, уже можно сделать не экстраполяцию, и интерполяцию, и пересчитать результат.
Я все надеюсь, что Дима это таки сделает - хотя кому это (кроме нескольких фриков) нонче интересно.
Reply
> 1. Когда ты вычислял baseline для смертности по РФ, ты использовал
экстраполяцию тренда. Многие (и я в том числе) говорили, что это опасное
упражнение. Теперь можно проверить, насколько экстраполяция была
обоснованной (спойлер: по-моему, вполне). Насмотря на то, что проверка
делается задним числом, это, по-моему, очень важная проверка,
валидирующая одно из самых сильный предположений в модели.
Не очень плнимаю - а как теперь можно это проверить? Эпидемия же еще не закончилась. Ты имеешь в виду, что когда все уляжется, то кривая смертности должна выйти на предсказанную экстраполяцию?
По России сырые данные выглядят так:
Что тут скажешь? Во-первых, линейная экстраполяция дает не очень сильный эффект, сравни три черные линии внизу. Во-вторых, реальная смертность летом 2022 (оранжевая) колебалась где-то вокруг, в июле даже упала ниже прогноза-2022. Но потом опять пошла вверх. Мне кажется, тут трудно в данных увидеть, была обоснованной экстраполяция или нет.
> Ты использовал одну и ту же baseline для обоих ковид-сезонов. Теперь
можно ее еще точнее скорректировать (да хоть и по месяцам), что,
насколько я понимаю, приведет к некоторому увеличению изб.смер.
Насколько это важно, черт его знает, но было бы более аккуратненько.
В анализе по регионам России я делаю экстраполяцию на 2020, а потом использую тот же бейзлайн в 2021 и 2022. Так исторически сложилось. Но в анализе по странам мира я всегда экстраполирую тренд дальше, на 2020/21/22, т.е. в каждом году свой бейзлайн. На картинке приведенной выше как раз показаны эти три бейзлайна.
Reply
ну, значит надо еще подождать. Хотя тенденция понятна, да.
Но вдруг еще что-то попадется, из совсем недавнего...
Reply
Но все-таки я настаиваю: на три года. Время быстро летит - но последний доковидный год был 2019.
И обычно мы тут экстраполируем, например, тренд 2015-2019. Бейслайн на 2020 - это экстраполяция на год вперед, 2021 - на два года вперед, а нынче уже 2022 заканчивается...
Reply
Leave a comment