Есть тест на редкую болезнь (ну, или на какое-то другое редкое свойство). Характеристики: точность 99%, полнота - 99%. И ещё известно, что болезнь встречается очень редко: один раз на 10000. Примененный к некоему человеку этот тест дал позитивный ответ. Какова вероятность того, что человек действительно болен?
Чтобы было попроще, давайте предположим, что мы протестировали целый миллион человек. Встречаемость у нас 1 на 10000 - поэтому среди этого миллиона имеется примерно сто больных. Полнота классификатора - 99% - поэтому из этой сотни больных мы успешно опознали примерно 99, и потеряли примерно одного. Здоровых людей в миллионе - почти все (миллион минус примерно 100). К ним всем применили тест, а его точность - 99%. То есть, на примерно 10000(десяти тысячах) здоровых людей тест дал положительную (то есть ошибочную) реакцию. Итого, среди тех, на ком тест дал положительную реакцию, у нас примерно 99 больных и примерно 10 тысяч здоровых. То есть больных у нас среди позитивных - примерно 1 процент. Вот так-то. Хотите - верьте, хотите нет. ___
Это сокращенный вариант вот этого поста. В нем больше подробностей и очень интересные комменты.