Даррел Хафф. Как лгать при помощи статистики

Sep 15, 2021 17:23

Durrel Huff. How to lie with statistics

Удивительное дело, книга написана в 1954 году, но несмотря на достижения в области статистики и big data, несмотря на изобретение компьютера и смартфона, книга Хаффа по-прежнему актуальна.

Главный вывод: любую цифру необходимо подвергать сомнению, и всегда задавать уточняющие вопросы: Кто попал в вашу выборку? Любой ли человек с одинаковой вероятностью мог попасть в вашу выборку? Что является причиной, а что следствием? И т.д.

Например, среди курящих студентов больше двоечников. Вопрос: это курение доводит до такого состояния, или студенты курят, потому что плохо успевают? А может, курение и плохая успеваемость вызваныодной причиной, скажем, апатичностью?

Попробуем перевести это на нынешнюю ситуацию. Нам говорят, что смертность в 2020 году увеличилась на Х. Самые осторожные просто констатируют этот факт, менее умные утверждают, что смертность выросла из-за к*. Но в 2020 году происходили и другие события: локдаун, экономический кризис, разрушение социальных связей, запрет на проведение плановых медицинских процедур и т.д. Кто-нибудь подсчитал, сколько человек погибло от этих мер? Можно ли в принципе вывести эту цифру?

Например, количество летальных исходов от передозировки наркотиков в США выросло на 30% в 2020г., превысив 93 тысячи, что является самым высоким показателем за всю историю наблюдений. А какие цифры нужно еще учесть, анализируя избыточную смертность? Количество вовремя не выявленных случаев рака, вовремя не проведённых кардиологических процедур, алкоголь, депрессия, апатия… Что еще?



Среднее, медиана и мода на примере зарплат. Иллюстрация из книги Хаффа

Кстати, Хафф касается темы смертности. В частности, смертности от т.н. Великого Смога в Лондоне 5-9 декабря 1952г. (Один из эпизодов телесериала «Корона»). Общественность потрясали цифры. Сначала было объявлено, что от смога умерло 4000 чел., затем - 6000, сейчас некоторые говорят о 12000 погибших. Но Хафф задает такой вопрос, возможно, циничный, но оправданный: «А как насчет последующих недель (после смога)? Упал ли уровень смертности ниже средних показателей, указывая на то, что если туман убивал людей, то в основном тех, кто в любом случае умер бы в ближайшее время? Цифра (смертности) звучит впечатляюще, но отсутствие других цифр отнимает большую часть смысла».

Книга знаменита, и я с удивлением обнаруживал в ней высказывания, ставшие крылатыми. Например, «если лечить грипп соответствующим образом, он пройдет через неделю, если не лечить - через 7 дней».

Один психиатр однажды заметил, что практически все являются невротиками. Во-первых, такая фраза уничтожает значение слова «невротик». Во-вторых, какую выборку он имел в виду?.. Если человек нормален, психиатр его никогда не встретит.

Статистика - это не наука, а искусство. Вопрос в том, как преподнести ту или иную цифру.


теория игр, США, прочитано мной

Previous post Next post
Up