Разберем еще одну статью, которая якобы содержит данные для
фальшивого графика Фаучи.
В исследовании
Sci-Hub | Maturity of human immunodeficiency virus infection and incubation period of acquired immunodeficiency syndrome in injecting drug users | 10.1016/1047-2797(94)90038-8 (hkvisa.net) авторы наблюдают за 2 когортами ВИЧ-положительных. Среди наблюдаемых были те, кто вошел в исследование, уже будучи ВИЧ-положительным (общее число в двух когортах n = 912), и те, у кого сероконверсия произошла во время наблюдений (общее число в двух когортах n = 136). Авторам дано задание сделать вывод об «инкубационном периоде ВИЧ-инфекции».
1. Авторы не знают времени сероконверсии у первой группы и предлагают считать срок инфекции на основе %CD4-клеток. Если этот процент такой-то, то, значит, срок инфекции у пациента такой-то. Потом на основе этого «назначенного» основной массе наблюдаемых (n = 912) срока авторы делают выводы об «инкубационном периоде ВИЧ-инфекции». Нельзя не заметить, что данные наблюдений просто подменяются фантазиями авторов.
2. Откуда авторы берут соответствие между %CD4-клеток и сроком ВИЧ-инфекции? Для этого они предлагают выявить зависимость между %CD4-клеток и сроком ВИЧ-инфекции среди тех пациентов, сероконверсия у которых произошла после входа в исследование (n = 136). Допустимо ли экстраполировать выводы по ~10% от наблюдаемых на всю группу наблюдаемых?
3. Методология выявления зависимости из пункта 2 - это отдельный цирк.
a) Сначала n = 136 превращается в n = 109. То есть анализы 20% пациентов «теряются» сразу. Как таковой научной новизны в этом нет (cм.
тут и
тут), поэтому авторы демонстрируют и другие способы манипуляции данными.
б) На картинке показаны данные, на основе которых авторы вычисляют зависимость. Всего 253 измерения от 109 пациентов, при этом утверждается, что от каждого более 1 измерения.
Among the incident subcohorts, 89 subjects from the Baltimore subcohort and 20 from the Bronx supplied simultaneous observations on CD4 percent (x1) and platelet count (xl), providing a total of 253 data points (including the time t since seroconversion at which xl and x2 were observed).
Давайте оценим полноту этих данных. Более 1 - это минимум 2. 109*2= 218. Таким образом, у каждого пациента по 2 измерения, а у 253-218=35 из них по 3 измерения. Большее количество измерений просто не влезет в заявленное число измерений 253 для 109 пациентов.
Что здесь не так? У каждого пациента мало измерений за 5 лет. Читаем в методах:
median frequencies of study visits of 6 to 7 months in the Baltimore and 9 to 10 months in the Bronx study
Балтиморская когорта (n = 89) одна должна была дать 10*89=890 измерений. Когорта Бронкса (n=20) 6*20=120 измерений. 890+120=1010 измерений. А зависимость, напомню, считается на основе 253 измерений. Каким образом авторы потеряли 1010-253=757 измерений в статье не сообщается.
в) на основе 2-х измерений за 5 лет для основной массы наблюдаемых (из 109 пациентов только у 35 пациентов > 2 наблюдений) выводить закономерность - это еще одно серьезное обогащение научного метода.
г) по данным на картинке на самом деле вообще невозможно понять, %CD4-клеток уменьшался со временем или увеличивался у конкретного пациента. Красными линиями на картинке отметил, какая могла быть динамика %CD4-клеток для 2-х пациентов на самом деле. Закономерность авторы выводили не на основе средней динамики по динамикам всех пациентов, а перемешав в кучу измерения всех пациентов. У Васи на первом году ВИЧ-инфекции %CD4=30, у Пети на втором году ВИЧ-инфекции %CD4=20 - "это отрицательная динамика". Безусловно, подобный подход придает исследованию определенную научную новизну.
Пока я читал статью, в голове крутилось незабвенное: «И разве мой талант, и мой душевный жар не заслужили скромный гонорар?». Товарищу Бендеру надо было ехать не в Рио-де-Жанейро, а сразу в NIAID. Ну и данных для графика Фаучи в статье нет.