Горячее
Лучшее
Свежее
Подписки
Сообщества
Блоги
Эксперты
Войти
Забыли пароль?
или продолжите с
Создать аккаунт
Регистрируясь, я даю согласие на обработку данных и условия почтовых рассылок.
или
Восстановление пароля
Восстановление пароля
Получить код в Telegram
Войти с Яндекс ID Войти через VK ID
ПромокодыРаботаКурсыРекламаИгрыПополнение Steam
Пикабу Игры +1000 бесплатных онлайн игр Отправляйся в Скайдом — волшебную страну, парящую высоко в небе среди пушистых облаков! Всё вокруг сияет яркими красками, а в самом сердце этого чудесного мира тебя ждет увлекательная арена, где можно с удовольствием и пользой провести время, собирая ряды из одинаковых элементов.

Скайдом: три в ряд

Три в ряд, Головоломки, Казуальные

Играть

Топ прошлой недели

  • cristall75 cristall75 6 постов
  • 1506DyDyKa 1506DyDyKa 2 поста
  • Animalrescueed Animalrescueed 35 постов
Посмотреть весь топ

Лучшие посты недели

Рассылка Пикабу: отправляем самые рейтинговые материалы за 7 дней 🔥

Нажимая «Подписаться», я даю согласие на обработку данных и условия почтовых рассылок.

Спасибо, что подписались!
Пожалуйста, проверьте почту 😊

Помощь Кодекс Пикабу Команда Пикабу Моб. приложение
Правила соцсети О рекомендациях О компании
Промокоды Биг Гик Промокоды Lamoda Промокоды МВидео Промокоды Яндекс Маркет Промокоды Пятерочка Промокоды Aroma Butik Промокоды Яндекс Путешествия Промокоды Яндекс Еда Постила Футбол сегодня
0 просмотренных постов скрыто
3
MathNotForYou
MathNotForYou

Одна новость — и вся ваша история болезней на ладони: опыт США⁠⁠

20 дней назад

Элис ложится в больницу в США. Её лечащий врач и страховая компания имеют доступ к подробной информации о её состоянии, и нередко эти же данные известны и государственным органам штата. Тридцать три штата, владея такими сведениями, не просто хранят их у себя и не всегда ограничивают к ним доступ. Вместо этого они по закону передают или даже продают часть этих данных исследователям. И вот штаты обращаются к вам — как к специалисту по информатике, IT, политике, консультанту или эксперту по конфиденциальности — с вопросом: действительно ли эти данные обезличены? Можно ли по ним узнать конкретного человека? Чаще всего у вас нет чёткого понимания, насколько реален такой риск. В этом тексте рассказывается, как мне удалось сопоставить имена пациентов с «анонимными» медицинскими данными, проданными штатом Вашингтон, и как власти штата отреагировали на это. Подобные исследования помогают улучшать практику обмена данными, уменьшать угрозы для частной жизни и стимулируют разработку более надёжных технических решений.

Если кратко описать результаты: штат Вашингтон продаёт набор медицинских данных о пациентах за 50 долларов. В этом публичном наборе содержалась информация почти обо всех госпитализациях за один конкретный год: демографические характеристики пациентов, диагнозы, выполненные процедуры, имена лечащих врачей, названия больниц, общая стоимость лечения и способ оплаты. Имена и точные адреса пациентов были удалены, оставались только пятизначные почтовые индексы. В то же время в местных газетах за этот год регулярно выходили материалы со словом «госпитализация», где назывались имена людей, указывалось место их проживания и причина попадания в больницу, например авария или нападение. Тщательно проанализировав четыре новостных архива по штату Вашингтон в единой поисковой системе, удалось однозначно сопоставить записи в медицинском наборе данных с 35 из 81 таких газетных статей за 2011 год (то есть с 43 %), фактически привязав имена к конкретным записям пациентов. Все найденные совпадения были проверены и подтверждены независимой третьей стороной.

После того как была продемонстрирована возможность повторной идентификации пациентов, власти штата Вашингтон изменили порядок предоставления этих данных и ввели трёхуровневую систему доступа. Теперь любой желающий может бесплатно скачать только агрегированные статистические таблицы. За 50 долларов и при подписании соглашения об использовании данных можно получить уже сокращённый, частично отредактированный вариант набора. А полный доступ ко всем полям, которые были доступны до этого эксперимента, теперь предоставляется лишь ограниченному кругу заявителей, прошедших проверку.

Введение

Деидентификация — это практика, при которой из персональных данных убирают имя, адрес и другую явно идентифицирующую информацию. Логика проста: если по данным нельзя установить конкретного человека, ими можно делиться, не рискуя ему навредить.

«Повторная идентификация» — это ситуация, когда этот принцип нарушается: по формально обезличенным данным всё-таки удаётся понять, кому они принадлежат.

Юристы сегодня придерживаются двух противоположных взглядов на реальный риск повторной идентификации, и эти позиции важны и для специалистов по компьютерным наукам, и для ИТ-практиков, и для самих пациентов.

Пол Ом, профессор права из Джорджтауна, утверждает, что в современном мире с обилием данных сделать их действительно анонимными невозможно. Если это верно, логичный вывод — отказаться полагаться на технические методы защиты и искать нетехнические решения. Его оппонентка, Джейн Яковиц из юридического факультета Университета Аризоны, заявляет, что достоверных случаев повторной идентификации не было, а те, о которых говорили раньше, преувеличены или неправильно интерпретированы. Если права она, значит, текущие «кустарные» подходы к деидентификации уже достаточны и не требуют новых технологий или изменений в политике.

Хотя эти позиции противоречат друг другу, обе по факту тормозят развитие технологий защиты. Дифференциальная конфиденциальность, которая даёт формальные гарантии того, насколько ограничена возможность повторной идентификации, стала одним из ключевых направлений исследований в компьютерной конфиденциальности. Но даже если бы такие инструменты уже были широко доступны, ни одна из описанных юридических позиций не подталкивала бы к их активному внедрению. Чтобы новые технологии защиты конфиденциальности действительно начали применять, нужно донести до общества реалистичное представление о рисках и возможном вреде.

В качестве примера рассмотрим общедоступные данные о госпитализациях. Иногда информация о лечении выглядит совершенно безобидной — сломал руку, наложили гипс. Но бывают и другие случаи: например, после ДТП человека экстренно привозят в больницу, и там выявляют алкогольную или наркотическую зависимость. Понятно, что разглашение таких сведений может серьёзно задеть человека, поэтому к публикации данных о пациентах нужно относиться очень осторожно.

Несколько лет назад многие штаты США приняли законы, обязывающие больницы передавать информацию о каждом пациенте, госпитализированном в стационар. Большинство этих штатов затем широко распространяют копии этих данных для разных целей. Фактически любой желающий может получить открытую версию базы, где есть демография пациентов, диагнозы и проведённые процедуры, список лечащих врачей, структура платежей и сведения о том, каким образом оплачивался каждый случай госпитализации. Имена пациентов при этом убираются, но нередко сохраняются почтовые индексы.

Такие базы на уровне штатов существуют много лет и активно используются. Если бы с ними были серьёзные проблемы, можно было бы ожидать множество выявленных инцидентов. На момент написания текста автор не нашёл сообщений о нарушениях конфиденциальности, связанных именно с этими базами, хотя непонятно даже, куда и как о таких нарушениях можно сообщать. К тому же большинство людей вообще не знают о существовании этих государственных баз, поэтому, даже столкнувшись с утечкой или злоупотреблением, вряд ли свяжут её именно с открытыми данными штата.

С другой стороны, есть тревожные, хотя и не подтверждённые факты. В 1996 году в опросе компаний из списка Fortune 500 треть из 84 респондентов заявили, что используют медицинские данные сотрудников при решении вопросов найма, увольнения и продвижения. Неясно, насколько это соответствует действительности, но теоретически это возможно, и в условиях непрозрачного обмена данными выявить подобные злоупотребления почти нереально, хотя последствия могут быть крайне тяжёлыми. Поэтому необходим наглядный, конкретный пример того, как можно идентифицировать пациентов по таким данным.

Представим, что вы знаете, что некий человек обращался в больницу, а также примерно понимаете причину обращения и/или знаете его возраст, пол и почтовый индекс. Сможете ли вы найти его запись в государственной медицинской базе?

На первый взгляд, задача сопоставления пациентов с общедоступными медицинскими базами кажется академическим упражнением или праздным любопытством. Но на практике возможность пользоваться такими базами позволяет работодателям проверять здоровье сотрудников, банкам — учитывать медицинские сведения при оценке кредитоспособности, компаниям по анализу данных — строить личные медицинские профили, журналистам — узнавать о болезнях публичных фигур, а обычным людям — следить за состоянием здоровья друзей, родственников или соседей. Все эти акторы вполне могут знать, когда человек попадал в больницу, и иметь в распоряжении достаточно дополнительных сведений, чтобы найти его запись в открытой базе госпитализаций.

Закон HIPAA не распространяется на штаты

Закон о переносимости и подотчётности медицинского страхования (HIPAA) — федеральный закон США 1996 года, который регулирует обмен медицинскими данными: кто и при каких условиях врачи, больницы и страховые компании могут делиться информацией о пациентах. Однако государственные (штатные) базы медицинских данных под действие HIPAA не попадают. Когда штат выступает как сборщик и распространитель данных, он не считается «субъектом HIPAA». Кроме того, штат имеет право передавать данные так, как это разрешено законами самого штата и в том формате, который он сочтёт допустимым. Возникает вопрос: чем подход штатов отличается от требований HIPAA?

В Правилах конфиденциальности HIPAA есть положение «Безопасная гавань» (Safe Harbor), которое описывает, как можно публиковать медицинские данные. Там установлены конкретные ограничения:

  • в датах можно указывать только год, без месяца и дня;

  • почтовый индекс можно публиковать только по первым трём цифрам и только в том случае, если суммарное население всех индексов с такими первыми тремя цифрами превышает 20 000 человек;

  • если население меньше 20 000, вместо реального индекса указывается 00000;

  • из данных нужно убрать явные идентификаторы — имена, номера социального страхования, точные адреса и т.п.

Теперь сравним с практикой штатов. Среди тех, кто публикует данные о госпитализациях на уровне штата, лишь три штата делают это по стандартам HIPAA; остальные 30 этим стандартам не следуют. Многие из них включают более детальные сведения — например, указывают не только год рождения пациента, но и месяц. Другие, наоборот, дополнительно обобщают данные по сравнению с HIPAA: используют возрастные интервалы вместо точного возраста и/или публикуют диапазоны почтовых индексов, а не конкретные значения.

Предыстория

Под «повторной идентификацией» медицинских данных понимают ситуацию, когда удаётся точно и однозначно связать конкретного человека с его медицинской записью. Такие эксперименты уже проводились и раньше.

В 1997 году я узнала, что медицинская информация о госслужащих станет доступна довольно широкому кругу лиц. Владельцы данных убрали явные идентификаторы — имя, адрес и т.п. — в соответствии с тогдашними стандартами деидентификации. Однако в базе остались дата рождения, пол и пятизначный почтовый индекс. Простые прикидки заставили задуматься: в году 365 дней, пол — один из двух, средняя продолжительность жизни ~78 лет. Если перемножить, получается около 56 940 возможных комбинаций. При этом в среднем в одном пятизначном почтовом индексе проживает всего около 25 000 человек. Значит, многие комбинации «дата рождения + пол + индекс» будут уникальными.

Чтобы проверить гипотезу, нужно было найти конкретного человека в базе. Тогдашний губернатор Массачусетса Уильям Уэлд был идеальным примером: его дата рождения и домашний адрес в Кембридже были в открытом доступе. За 20 долларов я купила список избирателей Кембриджа, где для 54 805 зарегистрированных избирателей были указаны имя, адрес, дата рождения, пол и история голосования. Оказалось, что сочетание «дата рождения + пол + почтовый индекс» Уэлда уникально и в списке избирателей, и в медицинской базе, что позволило однозначно сопоставить его личность с записью в формально обезличенном файле о госслужащих.

Одна новость — и вся ваша история болезней на ладони: опыт США

История быстро дошла до Вашингтона, округ Колумбия, где как раз обсуждались вопросы конфиденциальности в здравоохранении в рамках будущего закона HIPAA. Этот эксперимент по повторной идентификации заметно повлиял на формирование правил конфиденциальности HIPAA, и меня упомянули в преамбуле. Обсуждение случая Уэлда также привело к усилению защиты демографических данных в регулировании по всему миру.

После этого было проведено ещё несколько экспериментов по повторной идентификации. Сразу после истории с Уэлдом я сделала множество подобных проектов, но страх, шок, непонимание и отсутствие финансирования привели к тому, что результаты так и не были опубликованы. Например, в деле «Университет Южного Иллинойса против Департамента здравоохранения» сам Департамент признал, что я успешно повторно идентифицировала детей по комбинации {тип рака, почтовый индекс, дата постановки диагноза}. Суд в решении похвалил мой профессионализм, адвокаты называли меня «богиней повторной идентификации», но одновременно суд засекретил детали методики и запретил её публикацию. То же самое произошло и с другими ранними работами по повторной идентификации данных опросов и фармацевтических исследований.

В тех немногих случаях десять лет назад, когда эксперименты удавалось довести до публикации, журналы всё равно часто отказывали — и не из-за качества науки. Издания по информатике не хотели публиковать работы, где описывалась только атака с повторной идентификацией, без готового технического «лекарства», хотя авторы и утверждали, что сами такие атаки должны стимулировать создание новых технологий защиты. Журналы по политике в области здравоохранения, напротив, боялись, что публикация таких результатов нанесёт удар по существующей практике обмена данными, хотя именно рост масштабов обмена за счёт технологий требует их пересмотра. В итоге даже пример с Уэлдом и анализ демографической уникальности, которые позже повлияли на глобальное регулирование конфиденциальности, были первоначально отклонены более чем 20 научными журналами.

Финансирование тоже давали неохотно. Десять лет назад гранты на эксперименты по повторной идентификации обычно выдавали только при условии, что результаты покажут отсутствие риска или что все проблемы можно будет «закрыть» некой модной теоретической технологией, находящейся в разработке. Если ожидался неудобный результат о реальных рисках, деньги, как правило, не выделялись — а без них трудно провести систематические исследования.

Отсутствие опубликованных данных сыграло на руку критикам, которые стремились убедить общество, что рисков почти нет (иногда, доходя до сильных искажений фактических сведений о повторной идентификации).

Спустя десять лет Эль Эмам и соавторы провели обзор литературы и нашли всего 14 опубликованных атак с повторной идентификацией. Из них 11 они исключили, посчитав, что это лишь демонстрационные или оценочные атаки исследователей, а не «реальные» повторные идентификации, проверяемые на практике. В эту группу они, например, отнесли работу Нараянана и Шматикова, которые показали, как можно повторно идентифицировать пользователей по набору анонимизированных историй просмотров Netflix, сопоставляя их с публичными (идентифицированными) отзывами о фильмах. Хотя Эль Эмам и коллеги в своём обзоре фактически «отмахнулись» от этого эксперимента, он вылился в расследование Федеральной торговой комиссии США и судебный иск, который Netflix затем урегулировал.

Из трёх оставшихся, признанных «реальными» повторными идентификациями, две Эль Эмам и соавторы отвергают как не соответствующие стандартам HIPAA. Оставшееся исследование они, напротив, представляют как выполненное по требованиям HIPAA и демонстрирующее очень низкий риск повторной идентификации. Однако в этом эксперименте авторы по сути только заново воспроизвели мой старый эксперимент времён до HIPAA, но уже на данных, отредактированных по HIPAA. Работа была чрезмерно зациклена на одном конкретном сценарии и не учитывала другие возможные стратегии атак, которые могли бы оказаться успешнее. Это серьёзный недостаток, который Эль Эмам и коллеги не учитывают. Тем не менее их обзор подчёркивает: нам по-прежнему не хватает целостного понимания реальных рисков повторной идентификации.

Такое бедное состояние науки о рисках повторной идентификации в мире, где объём данных и их доступность постоянно растут, сегодня вызывает ещё больше тревоги, чем десять лет назад. Отсюда логичный вопрос: можно ли сейчас, при текущем уровне технологий и открытости данных, повторно идентифицировать пациентов по медицинским данным штатов?

Это была только вводная часть

В премиум-версии материала показан сам эксперимент: как новости, ZIP-коды и дата рождения превратились в имена и диагнозы, что ответили пациенты по телефону и почему после этого штаты срочно переписывали законы о конфиденциальности.

Поддержите автора

  • В премиум-разделе уже восемь объемных материалов, раскрывающих математику с самых разных сторон!

  • Подписывайтесь на телеграм-канал «Математика не для всех»

Показать полностью 1
Математика Яндекс Дзен (ссылка) Исследования Персональные данные Длиннопост
1
11
MathNotForYou
MathNotForYou

Как вероятность 1 к 73 000 000 стала приговором для матери двух младенцев: дело Салли Кларк⁠⁠

2 месяца назад

Ноябрьским вечером 1999 года присяжные собрались произнести вердикт в зале Честерского суда. На скамье подсудимых – 35-летняя адвокат из Чешира по имени Салли Кларк, мать двоих умерших младенцев. За окном холодно, а внутри – мёртвая тишина. Только что эксперт-педиатр сэр Рой Мидоу спокойно сообщил ошеломляющую цифру: вероятность того, что две здоровые дети из одной благополучной семьи скончались естественной смертью, равна «примерно одному шансу из 73 миллионов». Присяжные переглянулись: такое случается реже, чем раз в столетие. Казалось, сама статистика шепчет обвинение. Через несколько часов Салли услышит слово «виновна» – и звук захлопывающейся тюремной двери на долгие годы.

Два трагических случая легли в основу процесса. В декабре 1996 года первый сын Салли, 11-недельный Кристофер, внезапно перестал дышать в своей колыбели. Врачи назвали причиной «синдром внезапной детской смерти» (СВДС), то есть непредсказуемая гибель младенца без видимых причин. Горе молодых родителей не укладывалось в голове, но они старались жить дальше. Спустя год, в январе 1998-го, случилось немыслимое: умер второй сын, 8-недельный Гарри, тоже внезапно, во сне. Два случая СВДС в одной семье – статистическая редкость. Полиция, получив сигнал от патологоанатома, заподозрила худшее. Салли и её мужа арестовали по обвинению в убийстве младенцев, хотя ни прямых улик, ни мотива, ни признаков насилия не находили. Отца вскоре отпустили, а вот мать предали суду: против неё играла сама невероятность двух несчастий подряд.

Главным козырем обвинения стал профессор Рой Мидоу – авторитетный педиатр, много лет изучавший случаи детской смерти. Его свидетельство произвело эффект разорвавшейся бомбы. Мидоу вывел, что для семьи вроде Кларков (благополучной, некурящей, с достатком) шанс потерять ребёнка от СВДС – около 1 к 8 543. Такие случаи крайне редки. А вероятность, что несчастье случится дважды, он предложил найти перемножением: 1/8543 × 1/8543 ≈ 1/73 000 000.

«Один на 73 миллиона», – повторил эксперт, сравнив эту удачу с тем, чтобы угадать победителя скачек с коэффициентом 80:1 четыре года подряд.

Суд притих – число подействовало завораживающе. В сознании присяжных эта астрономическая дробь превращалась в уверенность: не может же такое случиться случайно, значит, перед нами убийца.

Однако за громкой цифрой скрывалась ловушка условной вероятности. Мидоу, сам того не желая, подвёл присяжных к опасной логической подмене. Он вычислил вероятность два ребёнка умерли естественно, приняв невиновность матери, но это число прозвучало как вероятность невиновности самой матери. В зале суда произошло то самое «транспонирование условий», которое называют прокурорской ошибкой: шанс наблюдать такое стечение обстоятельств превратился в шанс оправдать обвиняемую.

Между тем это вовсе не одно и то же. Сказать «шанс двух случайных смертей – 1 к 73 миллионам» – не значит сказать «шанс невиновности – 1 к 73 миллионам». Чтобы оценить, виновна Салли или нет, нужно сопоставить две конкурирующие версии: малыши погибли сами по себе или их убили. Цифра от Мидоу касалась лишь первой половины этой дилеммы и ничего не говорила о второй. Присяжные же, услышав про 73 миллиона, могли решить, что альтернативы невиновности попросту нет.

Не успел суд понять эту подмену, как с цифрой случилась ещё одна метаморфоза. Статистика Мидоу основывалась на допущении, что смерти двух детей были независимы – словно молния никогда не бьёт дважды в одно место. Это ключевое условие позволило перемножить вероятности, но именно оно крайне сомнительно. Есть веские причины полагать, что случаи СВДС внутри одной семьи не независимы. Неизвестные генетические факторы, особенности здоровья или обстановки – всё это может повысить риск повторного трагического исхода. Проще говоря, если в семье уже случилась детская смерть, вероятность второго случая вовсе не такая ничтожная, как при расчёте «с чистого листа». Сам профессор Мидоу не учёл этого: он сложил все лучшие условия семьи (благосостояние, заботливые родители, отсутствие вредных привычек) и на их основе вычислил вероятность СВДС, но те же самые факторы снижают и вероятность криминала. Семья, где дети растут в любви и достатке, – группа низкого риска не только для синдрома внезапной смерти, но и для насильственного убийства. Эта логическая ловушка позднее была подчёркнута независимыми экспертами: благополучие Кларков отнюдь не превращало версию убийства в более вероятную, как могло показаться присяжным.

Возвращаясь к той самой цифре, стоит спросить: даже если бы шанс двух случайных смертей равнялся 1 к 73 000 000, насколько уверенно можно было бы считать Салли убийцей? Представим на минуту альтернативу: вместо трагедии по воле случая дети погибли от рук матери. Какова вероятность двойного младенческого убийства в столь же благополучной семье? Таких данных нет в простом эпидемиологическом справочнике, но логично, что матерей, убивших двоих детей, – исчезающе мало. Если честно попытаться численно сравнить обе гипотезы, может статься, что двойное убийство встречается ещё реже, чем двойной СВДС. Именно это по сути и выяснилось позднее. В 2002 году встревоженное профессиональное сообщество статистиков выступило с открытым письмом: Королевское статистическое общество Великобритании прямо указало, что цифра «1 к 73 миллионам» не имеет под собой надёжной основы, и подчеркнуло: независимость двух случаев СВДС – недоказанное и, скорее всего, неверное предположение. А в 2004-м профессор математики Рэй Хилл проанализировал реальные данные по повторным детским смертям и пришёл к выводу: пережив одну потерю, семья входит в группу риска, где шанс второго СВДС повышается в 5–10 раз. Произведя более корректные расчёты, он показал, что даже без всяких новых улик вероятность невиновности Салли Кларк оставалась очень высокой. Другими словами, при сопоставлении двух редчайших сценариев – случайной гибели детей и намеренного убийства – первый оказывался по меньшей мере не менее вероятным. Статистика, задумавшаяся над альтернативой, уже не рисовала облик чудовища. Но, к несчастью, эти рассуждения прозвучали слишком поздно.

В 1999 году суд присяжных был очарован цифрами. Огромное число «1 из 73 000 000» подействовало гипнотически. Позднее Апелляционный суд Англии по образному выражению вспомнит про «математику-колдуна, околдовывающего искателя истины», но тогда, в процессе Салли Кларк, эффект больших чисел едва ли не подавил здравое сомнение. Присяжные не были статистиками – да от них этого и не требовалось. Им достаточно было услышать бесстрастный голос эксперта с красивым расчётом, чтобы ощущение невероятности переросло в убеждённость. Ни одно слово защитника уже не могло поколебать стройность 73-миллионной дроби.

Вердикт был вынесен 9 ноября 1999 года: виновна в убийстве обоих сыновей, с обязательным наказанием – пожизненным заключением. Салли отправилась в тюрьму, став изгоем: сокамерницы травили её как детоубийцу, пресса клеймила чудовищем в облике матери. Её муж, тоже юрист, разорился в попытках добиться пересмотра дела. Лишь в 2000 году, когда первые эмоции улеглись, тема статистической ошибки робко вышла на свет. Нашлись учёные, указавшие на прокурорскую ошибку и недопустимость превращать редкость события в доказательство вины.

Статья Нила Килинга, описывающая взгляды профессора Рэя Хилла на дело Салли.

Статья Нила Килинга, описывающая взгляды профессора Рэя Хилла на дело Салли.

В октябре 2000-го состоялось первое апелляционное слушание, где защита попыталась оспорить приговор, указав на непродуманность «73-миллионного» аргумента. Однако судьи тогда оставили приговор без изменений. В их глазах, помимо статистики, имелись и другие косвенные доводы против Кларк – например, не до конца понятные результаты вскрытия младшего ребёнка. Апелляция отметила: да, цифры могли ввести присяжных в заблуждение, но и без них доказательства выглядят убедительно. Салли осталась за решёткой.

Прошло ещё два года борьбы, прежде чем выплыла на поверхность скрытая ранее улика, перевернувшая ход истории. Оказалось, что ещё в 1998 году патологоанатом взял образцы крови второго малыша – Гарри – и обнаружил в них опасную бактерию Staphylococcus aureus. Эта находка могла означать инфекцию, способную вызвать смерть ребёнка естественным путём. Улика почему-то затерялась в деле: ни суд, ни эксперты о ней не знали, хотя защита напрямую спрашивала об анализах крови.

Золотистый стафилококк

Золотистый стафилококк

Когда правда вскрылась, комиссия по пересмотру уголовных дел немедленно направила дело Кларк в Апелляционный суд повторно. На слушаниях зимой 2003 года прозвучало уже два новых мотива к пересмотру приговора. Во-первых, скрытое медицинское доказательство: если Гарри умер от инфекции, никакого убийства не было и в помине. Во-вторых, к тому моменту и сами судьи осознали, насколько непрочна была статистическая основа обвинения. В решении суда 11 апреля 2003 года отметили, что свидетельство профессора Мидоу не должно было предлагаться присяжным в том виде, в каком прозвучало.

«Громкие цифры 1 к 73 миллионам, подогретые ярким примером с выигрышем на скачках, вероятно, сильно повлияли на умы присяжных, несмотря на все усилия судьи умалить их значение», – констатировали апелляционные судьи.

Вердикт 1999 года был отменён, Салли Кларк – оправдана и освобождена в зале суда после более чем трёх лет тюрьмы. Но радости не наступило: «Тут нет победителей, – сказала она журналистам. – Мы просто счастливы, что наш кошмар наконец закончился».

Салли Кларк

Салли Кларк

Кошмар действительно оставил тяжёлый след. Салли так и не смогла оправиться от тюремных лет: пережитое обернулось тяжёлой депрессией и зависимостью. В 2007 году, в возрасте 42 лет, Салли Кларк скончалась от отравления алкоголем – фактически, сломленная испытанием, которое ей выпало вынести. Тем не менее история её дела не прошла даром для системы правосудия. Напротив, «дело Салли Кларк» стало поворотным уроком для британских судов. После неё несколько аналогичных приговоров (в том числе дел, где фигурировал всё тот же профессор Мидоу) были оперативно пересмотрены, а обвиняемые – освобождены.

Медицинское сообщество пересмотрело подходы к расследованию детских смертей, усилив требования к экспертизе. Статистики заговорили с юристами: Королевское статистическое общество добилось, чтобы эксперты впредь крайне осторожно обращались с вероятностями в зале суда. Главное – признали хрупкость чисел вне контекста. Красивая оценка шанса сама по себе не может служить доказательством. Извлечённая из учебника вероятность должна звучать только вместе с оговорками, условиями и альтернативами. И уж точно нельзя напрямую превращать редкость события в уверенность в чьей-то виновности.

История Салли Кларк – трагическое напоминание о том, как легко очарование математики может обернуться заблуждением. Большое число, прозвучавшее как приговор, в итоге оказалось лишь миражом – и слишком поздно рассеялось, разрушив несколько жизней.

  • И эта история — лишь начало. Ошибки в обращении с числами не раз оказывались в центре судебных процессов. Уже вышла вторая статья, посвящённая делу People v. Collins из Калифорнии, где вероятности умножались на доске прямо на глазах у присяжных, превратив зал суда в лотерейный зал. Схожая завораживающая цифра — и вновь вопрос: где кончается статистика и начинается заблуждение?

  • Впереди ещё целая серия разборов — от ДНК-экспертиз в Британии до алгоритмов ИИ в американских судах. Часть этих историй будет доступна только по подписке Премиум: там мы подробно поговорим о том, как числа и формулы могут как помогать, так и искажать правосудие.

  • Подписка на телеграм-канал - это тоже важная форма поддержки!

Источники:

  1. R v Clark (Sally). Решение Апелляционного суда Англии и Уэльса от 11 апреля 2003 г. (№ 200203824 Y3, [2003] EWCA Crim 1020).

  2. Royal Statistical Society. Statement on Statistical Evidence in Court, October 23, 2001; Letter to the Lord Chancellor (Statistics and Cases), January 23, 2002.

  3. Ray Hill. “Multiple sudden infant deaths – coincidence or beyond coincidence?” Paediatric and Perinatal Epidemiology, vol. 18, 2004, pp. 320–326.

  4. Sara Gaines, David Pallister. “Sally Clark’s death accidental, coroner rules.” The Guardian, 7 November 2007.

Показать полностью 3
Telegram (ссылка) Математика Яндекс Дзен (ссылка) Правосудие США Ошибка Длиннопост
6
Yourhead
Yourhead

Тайны математиков: скрытые методы, странные привычки и неожиданные открытия⁠⁠

4 месяца назад
Тайны математиков: скрытые методы, странные привычки и неожиданные открытия

Математика кажется строгой и логичной наукой, где всё подчиняется четким правилам. Но за великими теоремами и формулами стоят живые люди — со своими странностями, сомнениями и необычными методами работы. Со временем некоторые их секреты стали известны, и оказалось, что путь к математической истине гораздо интереснее, чем можно представить.

1. Ошибки — неотъемлемая часть открытий

Миф: Великие математики всегда выдают безупречные доказательства с первого раза.
Реальность: Даже гении ошибались, иногда — катастрофически.

  • Леонард Эйлер, один из самых продуктивных математиков в истории, сформулировал множество гипотез, которые позже оказались неверными. Например, его предположение о том, что для любого многогранника выполняется формула (Вершин − Рёбер + Граней = 2), верно только для выпуклых многогранников.

  • Анри Пуанкаре первоначально ошибся в своей знаменитой гипотезе (позже доказанной Перельманом), но именно эта ошибка привела к созданию новой области — топологии.

  • Пьер Ферма оставил на полях книги пометку о своём "поистине удивительном доказательстве" Великой теоремы, но, скорее всего, оно было неполным или ошибочным — иначе зачем скрывать?

Вывод: Математика — это не только гениальные озарения, но и долгий путь исправления ошибок.

2. Интуиция и "нечестные" методы

Миф: Математические открытия рождаются только из строгих логических рассуждений.
Реальность: Многие прорывы начались с догадок, аналогий и даже физических экспериментов.

  • Бернхард Риман, работая над гипотезой о распределении простых чисел, использовал чисто интуитивные аргументы. Его догадки оказались верными, но строгое доказательство появилось лишь спустя десятилетия.

  • Карл Фридрих Гаусс признавался, что некоторые его открытия приходили "из воздуха", и лишь потом он искал формальное обоснование.

  • Сриниваса Рамануджан утверждал, что формулы ему во сне диктовала богиня Намагири. Хотя это звучит как мистика, многие его результаты позже были подтверждены.

Вывод: Иногда строгая логика — лишь финальный этап. Настоящие открытия часто начинаются с игры воображения.

3. Озарения приходят в странные моменты

Миф: Математики работают только за столом, окружённые книгами и формулами.
Реальность: Многие ключевые идеи приходили в самых неожиданных ситуациях.

  • Анри Пуанкаре рассказывал, что решение сложной задачи пришло к нему в момент, когда он заходил в автобус: "В момент, когда я поставил ногу на подножку, мне пришла в голову идея..."

  • Дмитрий Менделеев (хоть и химик) увидел свою периодическую таблицу во сне.

  • Альберт Эйнштейн (чей вклад в математику тоже огромен) говорил, что теория относительности зародилась у него в голове, когда он представлял, как бы выглядел мир, если бы он оседлал луч света.

Секрет: Мозг продолжает решать задачи даже в "фоновом режиме". Иногда лучший способ найти ответ — отвлечься.

4. Математики скрывали свои методы

Почему? Из-за страха критики, непонимания или желания сохранить преимущество.

  • Ферма не опубликовал доказательство своей теоремы, возможно, потому что оно было неполным.

  • Ньютон шифровал свои записи, опасаясь, что идеи украдут.

  • Гаусс иногда намеренно усложнял свои доказательства, чтобы коллеги не поняли, как он пришёл к результату.

Современный пример: Григорий Перельман, доказавший гипотезу Пуанкаре, отказался от премии в миллион долларов и исчез из публичного поля. Возможно, он просто не хотел участвовать в "математической политике".

5. Одиночество vs. Коллективный разум

Миф: Математик — это затворник, работающий в тиши кабинета.
Реальность: Даже самые гениальные одиночки нуждались в диалоге.

  • Переписка Лейбница и Ньютона (хоть и закончившаяся скандалом из-за спора о приоритете в открытии исчисления) ускорила развитие математики.

  • Группа Бурбаки (коллектив французских математиков) доказала, что даже в абстрактной науке важна командная работа.

  • XXI век: Современные доказательства иногда занимают сотни страниц и требуют collaboration десятков специалистов (как в случае с классификацией конечных простых групп).

Вывод: Математика — это не только личный гений, но и умение слушать других.

6. Странные привычки и суеверия

Математики — люди, и у них тоже есть свои ритуалы:

  • Поль Эрдёш работал по 20 часов в сутки, подкрепляясь кофеином и амфетаминами (хотя позже отказался от последних, выиграв спор).

  • Годфри Харди верил в "бога математиков" и боялся чисел, которые считал несчастливыми (например, 17).

  • Алан Тьюринг бегал марафоны, утверждая, что физическая активность помогает думать.

Заключение: математика — это не только цифры

За формулами и теоремами стоят живые люди с их страхами, сомнениями и необычными методами. Они ошибались, скрывали свои идеи, работали в одиночку или в команде, а иногда находили ответы во сне или на прогулке.

Главный секрет: Чтобы понять математику, нужно не только знать формулы, но и уметь мыслить нестандартно — как это делали величайшие умы в истории.

Мои соцсети:

Дзен: https://dzen.ru/mathandfiz

тг по математике: https://t.me/matemOGEEdMoun

тг по физике: https://t.me/fizikaOGEEdMoun

Показать полностью
[моё] Мышление Сознание Философия Реальность Математика Научпоп Мозг Развитие Свобода Telegram (ссылка) Яндекс Дзен (ссылка) Длиннопост
0
1
hidden10
hidden10

Математическая вселенная⁠⁠

5 месяцев назад

Математическая вселенная Макса Тегмарка: гипотеза о природе реальности

источник яндекс.картинки

источник яндекс.картинки

Макс Тегмарк — известный американский физик и космолог, профессор Массачусетского технологического института (MIT). Он автор одной из самых необычных и смелых гипотез в современной науке — гипотезы математической вселенной. Эта идея подробно изложена в его книге "Наш математический мир" (Our Mathematical Universe, 2014) и на страницах научных журналов.

источник яндекс.картинки

источник яндекс.картинки

Суть гипотезы

Гипотеза математической вселенной (Mathematical Universe Hypothesis, MUH) утверждает:

Наша физическая реальность не просто описывается математикой — она и есть математическая структура.

То есть, все существующее — это абстрактный математический объект. Не только законы природы подчиняются математическим уравнениям, но и сама реальность состоит из чистой математики. По мнению Тегмарка, если бы где-то существовала другая математическая структура, она тоже была бы реальной вселенной — с собственными "наблюдателями", "законами природы" и "объектами".

Основные идеи

1. Математика как основа всего

Тегмарк считает, что математика существует независимо от человеческого разума. Например, понятие треугольника или числа 7 существовало бы даже без людей. Если это так, то и все математические структуры существуют объективно.

2. Физика = Математика

Все физические объекты, включая элементарные частицы, поля и даже пространство-время, — это не более чем элементы некой абстрактной математической структуры.

3. Мультивселенная

Из гипотезы вытекает идея о существовании "мультивселенной" — бесконечного множества вселенных, каждая из которых реализует свою уникальную математическую структуру. Наша вселенная — лишь одна из них.

Аргументы в пользу гипотезы

• Эффективность математики

Математические формулы удивительно точно описывают природу (например, уравнения Максвелла для электромагнетизма или уравнения Эйнштейна для гравитации). Почему? MUH объясняет это тем, что природа сама по себе — математика.

• Симметрии и простота законов

Фундаментальные законы физики часто обладают красивыми симметриями и лаконичной формой, что характерно для математических структур.

• Объяснение "настройки" вселенной

Почему параметры нашей вселенной так точны и подходят для возникновения жизни? MUH предполагает: мы живём в одной из тех вселенных, где возможны наблюдатели.

Критика и вопросы

• Проблема объяснения сознания

Как в чисто математической структуре возникает субъективный опыт?

• Верифицируемость

MUH трудно проверить экспериментально: невозможно наблюдать другие математические структуры.

• Философская смелость

Скептики считают гипотезу слишком абстрактной и философской, а не научной.

Значение гипотезы

Несмотря на критику, идея Тегмарка вдохновляет многих учёных и философов. Она ставит под сомнение привычные представления о реальности и заставляет задуматься о том, что значит "существовать". Если MUH верна, то поиск "конечных" физических законов превращается в поиск самой подходящей математической структуры — той, в которой мы живём.

Заключение

Математическая вселенная Макса Тегмарка — это радикальный взгляд на природу реальности. Согласно этой гипотезе, всё сущее — это математика в чистом виде. Пусть эта идея пока остаётся философской спекуляцией, она расширяет горизонты мышления и задаёт новые вопросы о месте человека во Вселенной.

https://dzen.ru/a/aHoA6-p4FkyOSpdq (ссылка на статью в дзен)

Показать полностью 1
[моё] Физика Математика Вселенная Длиннопост Астрофизика Яндекс Дзен (ссылка)
2
user4650942
user4650942
Лига математиков

Близнецы Мерсенна: охота за четвёртым n⁠⁠

5 месяцев назад

При каких натуральных n числа 2^n-1 и 2^{n+2}-1 являются простыми?

На сегодняшний день известны всего три решения: 3, 5 и 17.

Как найти хотя бы ещё одно?

Близнецы Мерсенна: охота за четвёртым n | За право получать образование на родном языке | Дзен

Близнецы Мерсенна: охота за четвёртым n

Близнецы Мерсенна: охота за четвёртым n

Математика Образование Учеба Преподаватель Яндекс Дзен (ссылка)
0
1XoxLove7
1XoxLove7

Прогнозы на будущее...⁠⁠

6 месяцев назад
Прогнозы на будущее...

Прогнозы афганского математика и нумеролога Сидика Афгана на 2025 год вызвали значительный резонанс, особенно в связи с его предсказаниями о геополитических изменениях, включая возможный распад США и трансформацию Украины.
Кто такой Сидик Афган?
Сидик Афган — 67-летний математик, родившийся и выросший в Кабуле, в Афганистане. С юных лет он проявлял выдающиеся способности в математике, легко решая даже самые сложные задачи. Его образование началось в Кабульском университете, где он получил базовые знания, а затем продолжил обучение у советских математиков, углубляясь в такие области, как статистика и теория вероятности. Афган стал известен благодаря разработке уникального метода предсказаний, который он называет математической философией. Несмотря на критику со стороны научного сообщества и обвинения в шарлатанстве, он уверенно утверждает, что его методы помогли многим политикам принимать важные решения.
В конце 1970 годов Сидик Афган предсказал распад Советского Союза, который произошел в 1991 году. Хотя его прогноз оказался не совсем точным, он ожидал появления 44 независимых государств, в действительности же их оказалось 15, но это предсказание привлекло внимание к его работе.
Кроме того, Афган также предвидел теракты 11 сентября 2001 года, когда террористы атаковали башни Всемирного торгового центра в Нью-Йорке. Его способности к предсказанию событий продолжают вызывать интерес и споры среди ученых и общественности.

Сидик Афган утверждает, что он знает будущее России вплоть до 2065 года, но пока не раскрывает эти прогнозы, считая, что время для их озвучивания еще не настало. Однако он поделился своими предсказаниями относительно ближайших событий, охватывающих период с 2022 по 2025 год.
По мнению ученого, распавшийся Советский Союз возродится благодаря усилиям российских властей и народа, но в несколько измененной форме. Это новое объединение будет преимущественно политико-экономическим союзом, и в него постепенно будут входить все республики, которые отделились в 1991 году. Более того, Афган предполагает, что в этот союз могут вступить и другие страны, которые ранее даже не задумывались о таком шаге. Особое внимание он уделяет центру этого объединения, утверждая, что им станет город Чернигов, расположенный на территории современной Украины. Это предсказание вызывает интерес, особенно на фоне текущих глобальных изменений. С одной стороны, наблюдается распад однополярного мира, а с другой — возвращение исконных русских земель в состав России. Афган также предсказывает реформу образовательной системы и появление нового лидера, который, по его словам, родился в 1972 году. Однако он не уточняет, когда именно этот человек придет к власти. Говоря о текущем президенте Владимире Путине, Афган характеризует его как выдающегося политика и гения, чья дата рождения, по его мнению, предопределяет его лидерские качества.
Кроме того, математик предупреждает, что не ранее 2035 года Россия столкнется с новой волной коронавирусной инфекции. Тем не менее, он уверяет, что у страны достаточно ресурсов и сил, чтобы справиться с этой угрозой.
Дональд Трамп станет последним президентом США
Сидик Афган в своих прогнозах называет текущий год ключевым для всего мира, особенно для США, России и Украины. Он акцентирует внимание на том, как будет развиваться ситуация с специальной военной операцией и какие изменения произойдут в Америке на фоне радикальных реформ Дональда Трампа. По его мнению, будущее США выглядит мрачным, и страна может распасться на несколько частей, как это произошло с Советским Союзом. Возможно, это связано с его негативным отношением к двадцатилетней интервенции США в Афганистане.
"Дональд Трамп станет последним президентом США", — утверждает Сидик Афган.
Он говорит о существовании некоего "секретного комитета", который якобы стремится уничтожить 67% населения планеты. Однако ученый уверен, что в 2025 году эта организация будет разоблачена, и ее истинные намерения станут известны. Это предсказание, по его мнению, соотносится с выходом США из различных международных организаций, которые, распространяют негативные идеи по всему миру.
Также Афган предсказывает экологические катастрофы и конфликты, но не в привычном понимании. Он считает, что человечество столкнется с новыми вызовами, связанными с развитием искусственного интеллекта. Также математик предполагает, что Украина разделится на три части. Юго-восточные регионы присоединятся к России, западные территории будут поделены между Польшей, Венгрией и Румынией, а центральная часть останется независимой. По его подсчетам, этот процесс завершится к 2028 году.
Прогнозы Сидика Афгана, хотя и вызывают споры, основаны на его уникальной методике, сочетающей математику и исторический анализ. Его предсказания о распаде США, разделе Украины и возрождении России как центра нового мирового порядка остаются одними из самых обсуждаемых в 2025 году. Однако, как отмечает сам Афган, чем глобальнее прогноз, тем выше вероятность погрешности.

https://dzen.ru/a/aDcyI0GxbUfLo0Ll


Показать полностью 1
Предсказание Математика Нумерология Будущее Политика РИА Новости Яндекс Дзен (ссылка) Длиннопост
16
1
kznalp
kznalp
Статистика
Серия ITшное

Распределение значений бенчмарка⁠⁠

7 месяцев назад
Распределение  значений бенчмарка

Постановка эксперимента.
▫️Постоянная нагрузка (количество одновременных запросов) на СУБД
▫️Одинаковый запрос
▫️Длительный период наблюдения
Вопрос математикам :
▫️Какое распределение значений бенчмарка будет наблюдаться ?

Есть два ответа на данный вопрос:
1️⃣В идеальном случае , при минимальном влиянии инфраструктуры будет нормальное распределение , характеристики которого (отклонение, дисперсия, медиана ) и будут результатом эксперимента .
2️⃣Распределение может быть любым , даже мультимодальным и характеристики распределения будут результатами экспериментов .

Вопрос - какой ответ корректнее с математической точки зрения ?

P.S. По поводу второй точки зрения - я задавал вопрос авторам, но пока , в ответ тишина. А было бы очень интересно обсудить тему.

Показать полностью 1
[моё] Postgresql Математика Эксперимент Статистика Тестирование Вопрос Яндекс Дзен (ссылка)
5
7
kznalp
kznalp
Серия ITшное

Многие попадают в ловушку "среднего значения"...⁠⁠

8 месяцев назад
Многие попадают в ловушку "среднего значения"...

Еще одна иллюстрация к теме
О проблеме использования mean_exec_time при анализе производительности PostgreSQL

Юмор Математика Математический юмор Статистика Яндекс Дзен (ссылка)
5
Посты не найдены
О нас
О Пикабу Контакты Реклама Сообщить об ошибке Сообщить о нарушении законодательства Отзывы и предложения Новости Пикабу Мобильное приложение RSS
Информация
Помощь Кодекс Пикабу Команда Пикабу Конфиденциальность Правила соцсети О рекомендациях О компании
Наши проекты
Блоги Работа Промокоды Игры Курсы
Партнёры
Промокоды Биг Гик Промокоды Lamoda Промокоды Мвидео Промокоды Яндекс Маркет Промокоды Пятерочка Промокоды Aroma Butik Промокоды Яндекс Путешествия Промокоды Яндекс Еда Постила Футбол сегодня
На информационном ресурсе Pikabu.ru применяются рекомендательные технологии