Продолжаем знакомиться с книгой Дэвида Роберта Граймса "Неразумная обезьяна. Почему мы верим в дезинформацию, теорию заговоров и пропаганду."
Ссылки на предыдущие части: 1 2 3
Мы убедились, что не можем безоговорочно полагаться ни на своё восприятие, ни на память, ни на знание себя. Теперь я расскажу вам, что и язык цифр может быть обманчив. Самый, казалось бы, парадоксальный раздел математики - теория вероятностей. Она, подобно профессиональной гадалке, даёт нам возможность оценить шансы на будущее. И, как и гадалка, не несёт ответственности, если надежды не сбудутся. В наше время вероятности и статистика пропитали все поры общественной жизни. Но эти вещи далеко не так прозрачны, как хотелось бы нам. И, конечно, хватает дельцов, которые пользуются нашей неграмотностью.
Автор начинает с излюбленного рассказа западных аналитиков: условных вероятностей или теоремы Байеса. Для затравки: представьте себе, что вы играете в "Поле чудес" и выпал сектор приз. Якубович вытаскивает не две, а три шкатулки, в одной из них ключи от машины. Вы выбираете одну из шкатулок, и говорите ему, что выбираете её. Тогда Якубович открывает одну из двух оставшихся, и та оказывается пуста. И предлагает вам хорошенько подумать и, может быть, изменить свой выбор. Стоит ли так делать? И действительно: если вы измените свой выбор, то угадаете с вероятностью 2/3. Этот парадокс носит имя Монти Холла.
Или вот вам нужно сдать тест на корону. Вы живёте в Словакии. У вас в распоряжении суперский тест с точностью в 99,99%. Сдаёте – и он оказывается положительным! Какая вероятность, что у вас корона? Может, около 99% ? Ага, щас. На самом деле, всего 50%. Дело в том, что заболеваемость в стране низкая. На 10 тысяч всего один больной. И его-то тест обнаружит. Но будет ещё одно обнаружение. Оно – ложное. Ведь тест не стопроцентной точности. Получается, что даже с заоблачным качеством теста при низкой заболеваемости высок шанс получить ложно-положительный результат. Кто-то из читателей уже явно побывал в такой ситуации. А вот если бы вы жили в Британии с её полуторапроцентной заболеваемостью, то получить ложно-положительный результат было бы труднее. Шанс останется всего на уровне 0,66%.
Всё это кажется праздными рассуждениями, если бы статистическая неграмотность не служила причинами трагедий. Вот, например, так называемая ошибка прокурора. Есть такое заболевание – синдром внезапной детской смертности. Младенец перестаёт дышать и умирает в колыбели. Оно довольно редкое – один случай на 8543 ребёнка. Какова вероятность, что оба ребёнка в семье умрут этой смертью? Один случай на 8543 в квадрате, или 73 миллиона? Так думал выдающийся педиатр Рой Мидоу. В результате безутешная мать, дочь офицера полиции, получила срок за умышленное убийство своих детей. На счастье, нашлись добрые и бескорыстные люди, которые доказали, что эти два случая были связаны генетической предрасположенностью или экологией. Салли Кларк была оправдана после трёх лет за решёткой. Но окончательно она уже никогда не оправится.
Интерпретация статистики – ещё один подводный камень для тех, кто принимает решения. Самая распространённая ошибка – когда из корреляции, то есть совпадения трендов, выводится причинность. Её совершали средневековые врачи, которые считали, что люди заболевали не из-за бактерий, а из-за плохого воздуха. Именно желание избавиться от зловония, мыслимого причиной болезней, побудило строить канализацию в Лондоне. И оно помогло! Холера отступила. Но не ушла, ведь Лондон – большой, и нельзя всё разом поменять. Была новая вспышка, и один из скептиков, которого звали Джон Сноу, нашёл, что болезнь распространялась не вонью (хотя и той хватало), а одной из водозаборных колонок. Колонку закрыли, холера ушла. Местные власти обиделись на такое «самоуправство» и восстановили колонку. Холера вернулась. Вот так проявила себя инерция мышления. Пройдёт ещё семь лет, прежде чем, как Пастер откроет инфекционную теорию.
Ещё одним примером вольного обращения с данными послужила история компании Теранос под руководством небезызвестной Элизабет Холмс. Они вознамерились осчастливить человечество диагностическим тестом, который по паре капель крови распознает куче болезней. Но анализы не сдают просто так! Должны быть какие-то показания, симптомы. Ведь на самом деле чувствительность и специфичность анализов всегда ниже 100%. Если делать кучу анализов на всё – чего-нибудь всегда найдут. При чувствительности в 90% и 30 тестах шанс на то, что у вас что-то нароют – 95%, вот так. Теранос кончил неизбежным банкротством. Для себя я сделал вывод, что идти тестироваться просто так, не входя в группу риска, – не лучший метод заботы о своём здоровье.
Автор советует читателю не вестись на заголовки с шокирующей статистикой. Очень часто это лишь желание издания хайпануть. Они могут написать, скажем, о высоком относительном риске получить рак кишечника у мясоедов. Тогда как в абсолютном смысле этот риск составляет всего порядка процента. Обращать внимание нужно и на значимость результата, чтобы не быть введённым в заблуждение шумом или случаем. Альтернативные медики любят, например, проводить исследования на с тысячами, а с десятками пациентов, да ещё порой без плацебо. И получают неплохие цифры. Верить которым нельзя, потому что это по большому счёту мухлёж.
Конечно, недобросовестно проведённые исследования – бич не только альтернативной медицины. Малый объём данных, низкий эффект, существование других трактовок, вольные определения и методы, спонсорство, горячая тема исследования – всё это тревожные звоночки. В этом случае нужно задуматься. Таких случаев относительно мало в физике. Но медицина и биология – далеко не свободны от таких неаккуратных исследований.
Почему сами учёные страдают такой неаккуратностью? Ну, далеко не все из них – асы статистики. Далее: не получишь результат – не опубликуют. Да и новых грантов не жди. Вот и растёт число «мусорных» публикаций. Если по уму – так надо публиковать и неудачи. Отрицательный результат, ведь он тоже результат. Впрочем, метаанализ тоже может помочь нам отличить зёрна от плевел.
Не надо бояться чисел. Надо учиться искать противоречия и задавать дополнительные вопросы. Например, просить пересчитать проценты в абсолютные числа. И мухлёж вылезет наружу. Не сегодня, так завтра. Дерзайте, дорогу осилит идущий!