Раз уж в наших руках оказались полные еженедельные данные о смертности в России с разбиением на пол и возрастные группы по пять лет, можно посчитать избыточную смертность в 2020 для разных когорт.
О! В РФ, получается, смертность для мужиков вдвое больше, чем для женщин, а в Швеции и Израиле где-то раза в полтора. Интересно, почему так. Еще странный скачок в %% между когортами 80-84 и 85-90. В три раза! там точно все в порядке?
Интересно, почему так. Общее состояние здоровья у мужчин в России не очень. Все это помноженное на нашу традиционную нелюбовь обращаться к врачам, больше характерную именно для мужчин. Думаю, поэтому.
И нет, не очень в порядке как раз в этих группах. Очень возможно, что для М 85-89 бейслайн занижен (соотв. изб. смертность завышена)
Да вообще пока на каменты отвечал, сам все сообразил. У Росстата есть размеры когорт в т.ч. на 1 января 2021. Так что можно когорты на 2020 год интерполировать между двумя точками, а это уже гораздо точнее и model independent. Теперь все пересчитывать (а Дмитрий уже свои кривые пересчитал! - тут в каментах).
Без фундаментальной модели - нет, конечно. Наша эмпирическая функция может сколь угодно хорошо описывать прошлые данные - но у нас нет никакого способа узнать, совпадет ли наша экстраполяция с будущим.
Вот синтетический пример. Я взял простейшую функцию y=tan(x/50) и добавил к ней немного случайного шума. Первые 45 точек прекрасно описываются линейной функцией и экстраполяция выглядит вполне надежной:
Это у вас хороший и наглядный пример, спасибо. Но у меня решь шла ниже и выше о том, что увеличение степени полинома позволяют лучше описать уже имеющиеся данные.
Суть вопроса вот в чем: Если линейный тренд на всех имеющихся данных (2014-2020 годы) не проходит F-тест, против константы (среднего за весь период наблюдений), то, видимо, неправомерно использовать его, например, для оценки "избыточной смертности" в 2020 году на основе линейного и тем более квадратичного тренда за предыдущие годы (например, 2014-2019).
Ответил про Фишера в соседней ветке. Например, в данном синтетическом случае любой F-тест покажет, что линейная функция лучше константы (про параболу не уверен). Но это совершенно не значит, что линейная функция хорошо годится для экстраполяции (или хотя бы лучше константы в этом смысле).
Например, в данном синтетическом случае любой F-тест покажет, что линейная функция лучше константы (про параболу не уверен). *** А вы вот тут проверьте. Что-то мне подсказывает, что на женщинах F-тест не покажет значимость линейного тренда на всех уже имеющихся точках.
1. Мужчины 55-59: линейный тренд работает хорошо 2. Женщины 50-55: пример "параболического" тренда
Охотно допускаю. Но, как я уже сказал, львиная часть этих годовых колебаний - это изменение численности когорты. И вместо того чтобы гадать, какая функция лучше позволит нам описать и предсказать изменение размера когорты из года в год - можно просто взять нужные цифры прямо с сайта Росстата (в т.ч. и за 2020 год).
В РФ, получается, смертность для мужиков вдвое больше, чем для женщин, а в Швеции и Израиле где-то раза в полтора. Интересно, почему так.
Еще странный скачок в %% между когортами 80-84 и 85-90. В три раза! там точно все в порядке?
Reply
Общее состояние здоровья у мужчин в России не очень. Все это помноженное на нашу традиционную нелюбовь обращаться к врачам, больше характерную именно для мужчин. Думаю, поэтому.
И нет, не очень в порядке как раз в этих группах.
Очень возможно, что для М 85-89 бейслайн занижен (соотв. изб. смертность завышена)
( ... )
Reply
а сами таки взяли параболу!
Reply
а то вон оно как бывает:
https://covid19stat.livejournal.com/136442.html
Reply
Reply
Reply
Reply
Вот синтетический пример. Я взял простейшую функцию y=tan(x/50) и добавил к ней немного случайного шума.
Первые 45 точек прекрасно описываются линейной функцией и экстраполяция выглядит вполне надежной:
( ... )
Reply
Но у меня решь шла ниже и выше о том, что увеличение степени полинома позволяют лучше описать уже имеющиеся данные.
Суть вопроса вот в чем:
Если линейный тренд на всех имеющихся данных (2014-2020 годы) не проходит F-тест, против константы (среднего за весь период наблюдений), то, видимо, неправомерно использовать его, например, для оценки "избыточной смертности" в 2020 году на основе линейного и тем более квадратичного тренда за предыдущие годы (например, 2014-2019).
Reply
Например, в данном синтетическом случае любой F-тест покажет, что линейная функция лучше константы (про параболу не уверен). Но это совершенно не значит, что линейная функция хорошо годится для экстраполяции (или хотя бы лучше константы в этом смысле).
Reply
***
А вы вот тут проверьте. Что-то мне подсказывает, что на женщинах F-тест не покажет значимость линейного тренда на всех уже имеющихся точках.
1.
Мужчины 55-59: линейный тренд работает хорошо
2.
Женщины 50-55: пример "параболического" тренда
Reply
Но, как я уже сказал, львиная часть этих годовых колебаний - это изменение численности когорты. И вместо того чтобы гадать, какая функция лучше позволит нам описать и предсказать изменение размера когорты из года в год - можно просто взять нужные цифры прямо с сайта Росстата (в т.ч. и за 2020 год).
Reply
ну, навроде критерия Релея.
Reply
Reply
Reply
https://ria.ru/20201020/mikroskop-1580627541.html
Reply
Leave a comment