Как математика спасла жизнь подростку... реальная история !

После вчерашней истории про поиск девушки математическим способом многие как-то не прониклись идеей. Сегодня хочу расказать старую байку, которую наш учитель по математике в гимназии нам рассказал когда мы учили теорию вероятности, что бы мы запомнили, что иногда знание может спасти жизнь !!! Прошу не минусуйте просто так, а сначала прочтите и вникнете в идею.


Тема урока была Теория вероятности: Условная Вероятность по Байесу.


В любом медицинском тесте есть своя погрешность и свои отклонения. Врачи и ученые стараються повысить точность этих тестов, однако 100% пока не достигли. Бывает два типа ошибок. Первая, когда тест показывает отсутствие болезни у больного человека и второй тип, когда тест у здорового человека показывает болезнь. Так вот эту историю-байку наш учитель расказал нам как раз перед решением задач на эти ошибки.


Один молодой парень за компанию пошел с друзями провериться на СПИД после отпуска. Перед этим он с друзьями посмотрел, на тот момент, крайне популярный фильм "ДЕТКИ" (kids) и решил, что главной героине в конце реально не повезло, что она после одного раза заразилась СПИДом в то время как ее подружка спала со всеми парнями и оставалась здоровая. Так вот этот парень тоже решил после своего первого раза сходить и проверитсья... Как уже многие догадались тест показал "HIV+". У парня шок и депрессия. Это и понятно... Врачи сказали, что данный тест крайне точный и погрешность составляет всего 0,1%. Бедный парень захотел свести счеты с жизнью, потому что не представлял, как в свои 15 лет он будет жить с этой болезнью.


Его отец был инженером и подошел к вопросу строго математически и без эмоций. Он выспросил все данные об этом тесте и решил сам посчитать, какова вероятность, что тест оказался неправельным. Как выяснилось, врачи сказали действительно правду....но не всю. Вероятность ошибки теста для здорового человека действительно составляет всего 0,1%. Однако этот же тест у больного человека найдет болезнь только в 99% случаев. То есть у одного больного из 100 тест не найдет ничего. ОК,... зная это он узнал статистику больных СПИДом в Германии на тот момент. Болело по статистике от Института Коха около 70.000 человек. Это значит, что процент больных в Германии был около 0,1%.


А теперь прибегнем к старой доброй математике без эмоций и человечности:


Мы имеем:

Р(б) = 0,1% - процент больных по Германии


Это значит, что в Германии около 99,9% здоровых людей, то есть


Р(з) = 99,9%


Р(Б,+) = 99% - процент диагностики тестом болезни у больных людей


Р(З,+) = 0,1% - процент диагностики тестом болезни у здоровых людей


А теперь используя теорему Байеса находим сколько же людей, признанных тестом больными, действительно таковыми являються:


Р("Б"|Б)


Построим такую диаграмму зависимостей:

Как математика спасла жизнь подростку... реальная история ! Математика, Статистика, Теория вероятностей, Спасение, Везение, СПИД, Германия, Длиннопост
Из нее мы можем значения перенести в таблицу:
Как математика спасла жизнь подростку... реальная история ! Математика, Статистика, Теория вероятностей, Спасение, Везение, СПИД, Германия, Длиннопост

А теперь возьмем вероятность всех больных признаных таковыми тестом


Р(Б|+) = Р(б) * Р(Б,+) = 0,00099


и поделим на процент всех людей, которых тест признал больными


Р("Б") = Р(б) * Р(Б,+) + Р(з) * Р(З,+) = 0,001989


Получилось около Р("Б"|Б) = 49,77%. То есть из всех людей, которых тест признал больными, почти половина ими не являеться. Это означает, что если тест показал HIV+, то это шанс почти 50/50, что он в данном случае ошибся.


Счастливый отец бежит к сыну и говорит ему, что бы он еще раз прошел этот же тест.


Сын бежит в клинику и проходит тест еще раз. Результат: HIV- !!!!!  УРА УРА...!!! Теперь папа требует пройти этот же тест еще раз и опять результат отрицательный. Папа показывает расчеты и говорит, что теперь шанс на ошибку в тесте уже менее 0,1% а это значит, сын может расслабиться и прекратить думать о самоубийстве !!!


Вот так знание статистики помогло отцу спасти своего сына от смерти.


Мораль: Если вам самим не дай бог предстоит какой то важный медицинский тест и он не дай бог покажет у вас ту или иную болезнь, то не спешите плакать. Даже если врачи говорят, что вероятность ошибки теста крайне мала - они не знают что говорят. Математика на вашей стороне, так что пока не унывайте, а лучше посчитайте какая вероятность правельности у этого теста и пройдите его пару раз, что бы избежать реальной ошибки.


Всем добра !

Вы смотрите срез комментариев. Показать все
Автор поста оценил этот комментарий
Вот смотри ошибка. В вычислениях исходят из того, что в выборке людей на которых апробировался тест было в среднем 0.1% больных людей. Тогда и тест покажет 50% вероятность. Проверили 100 больных - 1 здоров, 99 больных (реально все больные). Проверили 99900 здоровых людей - 99800.1 человека здоровые и 99.9 больные (реально все здоровые). 99 делить на 99 + 99.9 и вот его 49.77%. Хотя показатели изначальные 99.9% и 0.1% были выявлены на выборках, где все 100% были либо здоровы либо больны (По крайней мере так написано исходя из условий задачи). А значит здесь ошибка в вычислениях.
раскрыть ветку (4)
Автор поста оценил этот комментарий

Ставим теорему под сомнение? ;)

раскрыть ветку (3)
Автор поста оценил этот комментарий
Ее неправильно применили
раскрыть ветку (2)
Автор поста оценил этот комментарий

Так опишите как "по вашему" правильно :)


Я из курса теорвера знаю только один способ ее применения :)

раскрыть ветку (1)
Автор поста оценил этот комментарий

Я все понял. Ошибался, все из-за терминологии.

Да, в германии больных 70000 , и это примерно 0.1% от населения (пусть так, это возьмем за аксиому).

Но тест проводился не на всей германии, и его вероятности 0.1% и 99.9% были составлены на 2 группах людей, где все были или только больные или только здоровые соответственно (это тоже аксиома, ведь нет же сомнений, что вероятности у теста получали не на всех подряд, а только на отдельно больных и отдельно здоровых).

В терминах условия задачи:

б -- это гипотеза, что человек из Германии болен.

з -- это гипотеза, что человек из Германии здоров.

б и з -- несовместные события.

Да, в задаче пишут, что:

Р(б) = 0,1% - вероятность встретить больного в Германии, соответственно вычисляют несовместную вероятность:

Р(з) = 100% - Р(б) = 99,9% - вероятность встретить больного в Германии.

Далее говорят, что:

Р(Б,+) = 99% - процент диагностики тестом болезни у больных людей

Р(З,+) = 0,1% - процент диагностики тестом болезни у здоровых людей

Это не так! Объяснение:

Б -- гипотеза, что человек на самом деле Болен.

З -- гипотеза, что человек на самом деле Здоров.

Гипотезы Б и З несовместны.

+ -- событие, тест показал Положительный результат (что человек Болен).

- -- событие, тест поеазал Отрицательный результат (что человек Здоров).

Р(+, Б) = 99% -- вероятность наступления события, что тест покажет Положительный результат (что человек Болен), когда человек на самом деле Болен.

Р(-, Б) -- вероятность наступления события, что тест покажет Отрицательный результат (что человек Здоров), когда человек на самом деле Болен.

Р(+, З) = 0.1% -- вероятность наступления события, что тест покажет Положительный результат (что человек Болен), когда человек на самом деле Здоров.

Р(-, З) -- вероятность наступления события, что тест покажет Отрицательный результат (что человек Здоров), когда человек на самом деле Здоров.

Далее ищут непонятное

Р("Б"|Б)

Что за хрень, что такое?

Хотят в задаче найти Р(б, +), заметь маленькая б! Ищут вероятность того, что истинна гипотеза, что человек из Германии на самом деле болен, когда произошло событие, что тест ему показал положительный результат.

Вот формула из википедии (очень аккуратно подставляю, сохраняя порядок гипотез и событий):

Р(б, +) = Р(б) * Р(+, б) / ( Р(б) * Р(+, б) + Р(з) * Р(+, з) ) , если мы принимаем здоровых людей из Германии, как просто здоровых людей (аналогично с больными), то :

= 0.001 * 0.99 / ( 0.001 * 0.99 + 0.999 * 0.001 ) = ~49.77%.

Воспринимать как: каждый день в германии диагностируют случайных людей и когда происходит положительный результат теста, то только у половины из них реально болезнь.

Другое вот блин дело, что похоже на правду, если только в реальности действительно случайно выбирают людей для диагностирования. А то как будто выбирают заведомо больных, или просто с повышенным риском. А еще можно напутать с терминами как я в таких задачах.

Вы смотрите срез комментариев. Чтобы написать комментарий, перейдите к общему списку