Простой алгоритм прогнозирования исхода COVID-19

May 15, 2020 17:17


Работа, результат которой обозначен в заглавии, выполнена с помощью математической обработки первичных клинических и лабораторных данных тяжелых больных COVID-19, госпитализированных в одну из больниц Уханя с 10 января по 18 февраля 2020. Для формирования прогностического алгоритма использовались методы, относящиеся к сфере искусственного интеллекта (ИИ). Более конкретно, использовалась интерпретируемая модель машинного обучения (machine-learning). «Интерпретируемая» означает, что логика предсказаний модели понятна человеку (есть ещё модели типа «черный ящик»; логика их предсказаний человеку не понятна) . В качестве инструмента применялся алгоритм «supervised XGBoost classifier (мне это мало что говорит, но может среди читателей есть специалисты по ИИ). Оговорюсь, я не компетентен судить насколько корректна методическая сторона этой работы. Но она опубликовано в одном из журналов семейства Nature (Nature Machine Intelligence), что предполагает прохождение профессионального рецензирования до принятия к печати и, в каком-то смысле, является «знаком качества» (впрочем, не всегда). Оригинал статьи здесь: https://www.nature.com/articles/s42256-020-0180-7.

Практически значимым результатом этой работы является простой алгоритм выявления больных, которым грозит неблагоприятный исход. Для этого требуется знание величин всего трёх рутинно определяемых лабораторных показателей:

1. Фермент лактат дегидрогеназы (LDH);  выше или ниже 365 ед/л

2. C-реактивный белок, определённый высокочувствительным методом (hs-CRP); ниже или выше 41.2 мг/л

3. Процент лимфоцитов; выше или ниже 15% (в оригинале 14.7%)

Наиболее информативным из этих показателей является уровень LDH. Если уровень LDH ниже 365 ед/л шансы на благоприятный исход высокие, если выше 365 ед/л высоки шансы неблагоприятного исхода.

Далее группа  «LDH ниже 365 ед/л»  делится на две подгруппы в зависимости от концентрации С-реактивного белка: если ниже 41.2 мг/л - прогноз благоприятный; если выше 41.2 мг/л нужно учитывать на процент лимфоцитов.

Наконец группа  «LDH ниже 365 ед/л; hs-CRP выше 41.2 мг/л» делится на две подгруппы в зависимости от процента лимфоцитов: если выше 15% - прогноз относительно благоприятный, но летальный исход возможен; если ниже 15% - высокий риск летального исхода.

Предлагаемый алгоритм позволяет прогнозировать исход заболевания с точностью около 90% за 10 и более дней до неблагоприятного исхода. Нужно отметить, что «машинное обучение» модели, производилось на данных одной больницы за период, когда методы лечения могли быть менее оптимальными чем сейчас. Иными словами модель предсказывает какие были бы исходы при условиях близким к тем, в которых модель «обучалась» Но модель можно «потренировать» и другими массивами данных.

Цель использования данного алгоритма не фаталистическое предсказание неблагоприятного исхода, а как можно более ранняя идентификация случаев, требующих более интенсивной «предупреждающей» терапии.

P.S. В продолжение темы: китайский калькулятор оценки риска критической формы COVID-19 при поступление в больницу. Базируется на анализе 72 потенциальных факторов риска у 1600 больных COVID-19. В калькулятор нужно вводит значения 10 параметров. Его англо-китайская версия здесь: http://118.126.104.170/
Previous post Next post
Up