В первой части были рассмотрены заблуждения и мифы насчет экспоненциального
роста количества инфицированных в РФ. Рассмотрим дальше.
В первой части
https://yacc11.livejournal.com/20062.html я рассмотрел как надо анализировать рост, чтобы представлять его реальную скорость.
Удивительно, но то квадратичное приближение, которое я предложил, до прошлых выходных, т.е. до 25-26 апреля, и которое было составлено на данных по 12 апреля включительно, вполне сносно предсказывало количество новых положительных тестов в Москве.
Сами можете оценить:
Однако примерно последнюю неделю количество новых положительных тестов, колеблется в диапазоне 2000-3000 для Москвы. Это говорит нам о том, что по ним мы выходим на плато.
Очевидно, что монотонно растущие функции типа экспоненты от линейной функции или квадратичной формы, далее не могут описать процесс.
Нам нужна функция, которая достигнет некого максимума и далее начнет спадать.
И такая функция была предложена в посте
https://olegmakarenko.ru/1839559.htmlпользователем
labgord вот тут
https://olegmakarenko.ru/1839559.html?thread=741047495#t741047495
Изначально я был к ней очень скептичен, ибо если считать что у нас именно экспонента - т.е. экспонента с линейной функцией внутри вида ( 1 ), то такого графика просто быть не может - и это описано в том посте.
Однако давайте представим что там внутри нечто больше.
В форме как на этом графике она малополезна для прогнозов, но ничего не мешает ее переписать в математической форме, хотя большинство, как я ранее упомянул, матанализ старших классов напрочь забыло.
Итак, пусть у нас отношение количества новых положительных тестов к суммарному количеству зараженных, описывается линией с отрицательным наклоном.
Это означает что это можно написать формулой (2), где коэффициенты а и b должны быть положительными. Минус перед а и означает что наклон будет идти вниз.
Возможно для школы это дифференциальное уравнение и сложное, но не для тех кто прошел первые курсы технических вузов.
В самом деле - давайте сделаем подстановку - пусть Z = ln Y. Вычислим от нее производную. Производная от логарифма - это обратная функция но при сложных аргументах надо еще домножить на производную от ее аргумента
Итого мы получаем нужное частное (3)
Т.е. фактически наша формула имеет вид (4)
Избавляемся от производной в левой части - для этого надо взять интеграл от правой.
Итого: получаем для логарифма формулу (5), а для самого Y - формулу (6)
Давайте проверим - возьмем от Y производную (7). Делим производную на саму функцию - экспонента сокращается и остается искомая линейная функция.
К этой же функции можно прийти и другим путем: Как любят говорить у Фрица Моргена "показатель экспоненты уменьшается"
Строго говоря это своеобразный оксюморон для математики, посему беру в кавычки.
Ок. Пусть показатель в первом приближении уменьшается линейно, скажем как в формуле (8) - т.е. подставив ее мы получаем то же, что получили выше из дифференциального уравнения.
Вот только это не вечно растущая экспонента, о которой изначально все вели речь, как о геометрической прогрессии, а а-ля Гауссиана - т.е она имеет вид "колокольчика".
Ровно как и прогрессия с уменьшающимся коэффициентом, скажем такого вида:
2 ; 2 * ( 1. 9 ) ; 2 * ( 1. 9 ) * ( 1. 8 ) ; и т.п.
не является геометрической прогрессией, ровно потому как дважды два - четыре, а не 3.5 и не 3 со временем - по определению .
Если коэффициент k - мал, то играет роль линейная часть при коэффициенте с но как только он начинает играть уже значимую роль, темп роста сильно сбавляется до нуля и дальше значение Y уже падает. Этот "колокольчик" имеет четкий максимум и не растет бесконечно.
Давайте попробуем его аппроксимировать по реальным значениям для Москвы и посмотреть насколько он подходит.
Тут подойдет МНК для квадратичной форме, использованной в первой части Для этого достаточно посчитать ln Y.
Как можно видеть, суммарное количество заболевших для Москвы она описывает очень неплохо:
А вот с ежедневным количеством новых положительных тестов хуже - модель их завышает. Но в общем и целом по среднеквадратичной ошибке за последние 18 дней она чуть лучше моего изначального квадратичного приближения и более того - описывает реальный случай перелома:
Таким образом можно прогнозировать плато в ежедневном количестве новых положительных тестов для Москвы на этой неделе, хотя суммарное количество будет продолжать расти где-то до середины мая.
Причем если считать что, с учетом колебаний, ежедневное количество новых положительных тестов - постоянно, т.е. Y' = a = const, то тогда суммарное количество заболевших будет расти линейно а частное ведет себя как 1/x (9)
Т.е. прямая на том верхнем графике процентов скоро сменится на более крутое падение - так говорит математика.
Реально же, на примере той же Италии, видим, что ежедневное количество новых положительных тестов не будет так резко падать, как следует из а-ля гауссианы, помноженной на линейную функцию.
Поэтому можно разве что предполагать скорое плато, но дальнейшие прогнозы на основе этой модели уже строить нельзя.
За более честным просчетом, по SEIR модели я могу отправить к
in_kant, который в своем ЖЖ считает численно именно дифференциальные уравнения эпидемиологической модели и периодически обновляет свои данные.
Итог: Тем не менее желаю всем не забывать матанализ, который позволяет судить о применимости той или иной модели на том или ином отрезке и правильно называть эту модель.