Книга
«Как лгать при помощи статистики» (вот здесь
оригинал на Amazon) - аж конца 50-х годов, но и в США она была переиздана в 2010. Это классика, которую должен прочитать каждый и сейчас. Во всяком случае, каждый, кто не хочет быть обманутым цифрами и графиками. Тот кусочек цвета фуксии над книжкой - куча моих закладок. Я к ней много раз буду возвращаться.
Почему не всегда нужно верить исследованиям? Результаты могут быть искажены по массе причин. Отвечая в опросах, люди могут просто-напросто говорить неправду.
«…в следующий раз, когда вы прочитаете, что средний американец (в наши дни вы узнаете об этом субъекте много всякой всячины, причем по большей части все это слегка неправдоподобно) чистит зубы 1,02 раза в день… задайте себе вопрос: каким образом кому-то удалось собрать такие сведения? Неужели женщина, начитавшаяся бесчисленных рекламных объявлений, где утверждается, что люди, не чистящие зубов, оскорбляют общественные устои, сознается совершенно незнакомому человеку, что делает это нерегулярно? Такого рода статистика может представлять интерес только для тех, кто хочет определить, что говорят люди о чистке зубов, но она мало что скажет о том, как часто щетка соприкасается с зубами респондентов».
***
«Чтобы данные выборочного исследования имели значительную ценность, они должны основываться на репрезентативной выборке*, то есть на выборке, из которой устранены все возможные источники предвзятости».
«Один психиатр заявил, что практически любой человек - неврастеник. Оставим в стороне тот факт, что подобное обращение с термином «неврастеник» лишает его всякого смысла, и посмотрим на выборку, послужившую основой для такого вывода. Иными словами, спросим себя: каких именно людей наблюдал данный психиатр? Оказывается, он пришел к такому поучительному выводу, изучая своих пациентов, а они более чем неподходящие кандидатуры на роль выборки из всего населения. Если бы человек был вполне нормален, у психиатра не было никаких шансов увидеть его у себя на приеме».
***
Кстати, именно поэтому нельзя делать выводов из привычек и поведения своего окружения. «Все сидят Вконтакте», «в Facebook более образованная и обеспеченная аудитория», «никто не покупает dvd, все давно скачивают фильмы из Интернета», «шляпки давно никто не носит», «все покупают в интернете» - без корректно проведенных исследований и опросов это бессмысленная информация. Вы (я, остальные) судим по тем, с кем мы пересекаемся. Но общаемся мы с людьми более-менее нашего круга и схожих интересов. Их мнение не может распространяться на все население страны.
***
«[все социологические опросы в целом грешат предвзятостью] Это крен в сторону людей более состоятельных, более образованных, более информированных и осторожных, с более пристойным внешним видом, общепринятым поведением и с более устоявшимися привычками, чем у того среднестатистического гражданина, представлять которого их выбрали.
Не так уж трудно понять, отчего такое происходит. Давайте представим, что вам поручили встать на углу улицы и задать ряд вопросов какому-то одному человеку. Вам попадаются на глаза двое прохожих, и оба вроде бы подходят под ту категорию, представителя которой вам предписано опросить, а именно - горожанина в возрасте старше сорока лет. Один прохожий одет чисто и аккуратно, другой же - во что-то непотребное, да к тому же угрюм и неприветлив на вид. Вы, чтобы выполнить свое задание, естественно, обратитесь к тому из двоих, кто выглядит приличнее, и точно так же поступают ваши коллеги-интервьюеры по всей стране».
«…как мы уже убедились, это вовсе не означает, что социологические опросы фальсифицируются - иными словами, что кто-то намеренно искажает их результаты, чтобы создать ложное впечатление. Свойственная выборке тенденция к систематическому смещению в сторону более состоятельных респондентов может исказить результаты любого опроса».
***
«Допустим, вы не можете доказать, что ваше замечательное лекарство излечивает от простуды, но никто не может вам помешать напечатать (крупным шрифтом) результаты настоящего лабораторного исследования: полкапли лекарства, помещенные в пробирку, через 11 секунд уничтожают 31 108 бактерий. И если уж взялись делать это, убедитесь, что упоминаемая вами лаборатория имеет надежную репутацию или внушительное название. Отчет воспроизведите полностью. Сделайте фото человека в белом халате и поместите рядом с отчетом.
Но не следует упоминать в своей истории несколько каверзных нюансов. Не вам же - или все-таки вам? - уточнять, что антисептические капли, так прекрасно показавшие себя в пробирке, возможно, не будут действовать столь же эффективно в горле у больного, особенно когда он разбавит их так, как того требует инструкция, чтобы не обжечь себе ткани носоглотки. Не наводите тень на плетень уточнением, бактерии какого рода пали жертвой вашего средства. Кто ж его знает, какие бактерии вызывают простуду - особенно если возбудитель простуды - вовсе не бактерии?
…но люди обычно не размышляют так уж серьезно над подобным вопросом, особенно когда у них хлюпает в носу».
***
В книге множество других смешных и абсурдных - зачастую реальных - примеров, как создают ложное впечатление, используя правильные статистические методы. Даже графики и картинки - при всей правильности - можно представить так, чтобы создать желаемое впечатление. Сейчас инфографика выходит на пик популярности, и понимание принципов манипуляции позволит не обманываться красивыми картинками.
_______
* Выборка - группа испытуемых (объектов, событий, образцов), которую выбрали с помощью определённой процедуры для участия в исследовании. Репрезентативная выборка - та, которая верно отражает общее число, то есть, в ней есть представители разных подгрупп из генеральной совокупности.