MathNotForYou

MathNotForYou

Автор блога "Математика не для всех"
На Пикабу
26К рейтинг 135 подписчиков 10 подписок 163 поста 39 в горячем
Награды:
10 лет на Пикабу
3

Одна новость — и вся ваша история болезней на ладони: опыт США

Элис ложится в больницу в США. Её лечащий врач и страховая компания имеют доступ к подробной информации о её состоянии, и нередко эти же данные известны и государственным органам штата. Тридцать три штата, владея такими сведениями, не просто хранят их у себя и не всегда ограничивают к ним доступ. Вместо этого они по закону передают или даже продают часть этих данных исследователям. И вот штаты обращаются к вам — как к специалисту по информатике, IT, политике, консультанту или эксперту по конфиденциальности — с вопросом: действительно ли эти данные обезличены? Можно ли по ним узнать конкретного человека? Чаще всего у вас нет чёткого понимания, насколько реален такой риск. В этом тексте рассказывается, как мне удалось сопоставить имена пациентов с «анонимными» медицинскими данными, проданными штатом Вашингтон, и как власти штата отреагировали на это. Подобные исследования помогают улучшать практику обмена данными, уменьшать угрозы для частной жизни и стимулируют разработку более надёжных технических решений.

Если кратко описать результаты: штат Вашингтон продаёт набор медицинских данных о пациентах за 50 долларов. В этом публичном наборе содержалась информация почти обо всех госпитализациях за один конкретный год: демографические характеристики пациентов, диагнозы, выполненные процедуры, имена лечащих врачей, названия больниц, общая стоимость лечения и способ оплаты. Имена и точные адреса пациентов были удалены, оставались только пятизначные почтовые индексы. В то же время в местных газетах за этот год регулярно выходили материалы со словом «госпитализация», где назывались имена людей, указывалось место их проживания и причина попадания в больницу, например авария или нападение. Тщательно проанализировав четыре новостных архива по штату Вашингтон в единой поисковой системе, удалось однозначно сопоставить записи в медицинском наборе данных с 35 из 81 таких газетных статей за 2011 год (то есть с 43 %), фактически привязав имена к конкретным записям пациентов. Все найденные совпадения были проверены и подтверждены независимой третьей стороной.

После того как была продемонстрирована возможность повторной идентификации пациентов, власти штата Вашингтон изменили порядок предоставления этих данных и ввели трёхуровневую систему доступа. Теперь любой желающий может бесплатно скачать только агрегированные статистические таблицы. За 50 долларов и при подписании соглашения об использовании данных можно получить уже сокращённый, частично отредактированный вариант набора. А полный доступ ко всем полям, которые были доступны до этого эксперимента, теперь предоставляется лишь ограниченному кругу заявителей, прошедших проверку.

Введение

Деидентификация — это практика, при которой из персональных данных убирают имя, адрес и другую явно идентифицирующую информацию. Логика проста: если по данным нельзя установить конкретного человека, ими можно делиться, не рискуя ему навредить.

«Повторная идентификация» — это ситуация, когда этот принцип нарушается: по формально обезличенным данным всё-таки удаётся понять, кому они принадлежат.

Юристы сегодня придерживаются двух противоположных взглядов на реальный риск повторной идентификации, и эти позиции важны и для специалистов по компьютерным наукам, и для ИТ-практиков, и для самих пациентов.

Пол Ом, профессор права из Джорджтауна, утверждает, что в современном мире с обилием данных сделать их действительно анонимными невозможно. Если это верно, логичный вывод — отказаться полагаться на технические методы защиты и искать нетехнические решения. Его оппонентка, Джейн Яковиц из юридического факультета Университета Аризоны, заявляет, что достоверных случаев повторной идентификации не было, а те, о которых говорили раньше, преувеличены или неправильно интерпретированы. Если права она, значит, текущие «кустарные» подходы к деидентификации уже достаточны и не требуют новых технологий или изменений в политике.

Хотя эти позиции противоречат друг другу, обе по факту тормозят развитие технологий защиты. Дифференциальная конфиденциальность, которая даёт формальные гарантии того, насколько ограничена возможность повторной идентификации, стала одним из ключевых направлений исследований в компьютерной конфиденциальности. Но даже если бы такие инструменты уже были широко доступны, ни одна из описанных юридических позиций не подталкивала бы к их активному внедрению. Чтобы новые технологии защиты конфиденциальности действительно начали применять, нужно донести до общества реалистичное представление о рисках и возможном вреде.

В качестве примера рассмотрим общедоступные данные о госпитализациях. Иногда информация о лечении выглядит совершенно безобидной — сломал руку, наложили гипс. Но бывают и другие случаи: например, после ДТП человека экстренно привозят в больницу, и там выявляют алкогольную или наркотическую зависимость. Понятно, что разглашение таких сведений может серьёзно задеть человека, поэтому к публикации данных о пациентах нужно относиться очень осторожно.

Несколько лет назад многие штаты США приняли законы, обязывающие больницы передавать информацию о каждом пациенте, госпитализированном в стационар. Большинство этих штатов затем широко распространяют копии этих данных для разных целей. Фактически любой желающий может получить открытую версию базы, где есть демография пациентов, диагнозы и проведённые процедуры, список лечащих врачей, структура платежей и сведения о том, каким образом оплачивался каждый случай госпитализации. Имена пациентов при этом убираются, но нередко сохраняются почтовые индексы.

Такие базы на уровне штатов существуют много лет и активно используются. Если бы с ними были серьёзные проблемы, можно было бы ожидать множество выявленных инцидентов. На момент написания текста автор не нашёл сообщений о нарушениях конфиденциальности, связанных именно с этими базами, хотя непонятно даже, куда и как о таких нарушениях можно сообщать. К тому же большинство людей вообще не знают о существовании этих государственных баз, поэтому, даже столкнувшись с утечкой или злоупотреблением, вряд ли свяжут её именно с открытыми данными штата.

С другой стороны, есть тревожные, хотя и не подтверждённые факты. В 1996 году в опросе компаний из списка Fortune 500 треть из 84 респондентов заявили, что используют медицинские данные сотрудников при решении вопросов найма, увольнения и продвижения. Неясно, насколько это соответствует действительности, но теоретически это возможно, и в условиях непрозрачного обмена данными выявить подобные злоупотребления почти нереально, хотя последствия могут быть крайне тяжёлыми. Поэтому необходим наглядный, конкретный пример того, как можно идентифицировать пациентов по таким данным.

Представим, что вы знаете, что некий человек обращался в больницу, а также примерно понимаете причину обращения и/или знаете его возраст, пол и почтовый индекс. Сможете ли вы найти его запись в государственной медицинской базе?

На первый взгляд, задача сопоставления пациентов с общедоступными медицинскими базами кажется академическим упражнением или праздным любопытством. Но на практике возможность пользоваться такими базами позволяет работодателям проверять здоровье сотрудников, банкам — учитывать медицинские сведения при оценке кредитоспособности, компаниям по анализу данных — строить личные медицинские профили, журналистам — узнавать о болезнях публичных фигур, а обычным людям — следить за состоянием здоровья друзей, родственников или соседей. Все эти акторы вполне могут знать, когда человек попадал в больницу, и иметь в распоряжении достаточно дополнительных сведений, чтобы найти его запись в открытой базе госпитализаций.

Закон HIPAA не распространяется на штаты

Закон о переносимости и подотчётности медицинского страхования (HIPAA) — федеральный закон США 1996 года, который регулирует обмен медицинскими данными: кто и при каких условиях врачи, больницы и страховые компании могут делиться информацией о пациентах. Однако государственные (штатные) базы медицинских данных под действие HIPAA не попадают. Когда штат выступает как сборщик и распространитель данных, он не считается «субъектом HIPAA». Кроме того, штат имеет право передавать данные так, как это разрешено законами самого штата и в том формате, который он сочтёт допустимым. Возникает вопрос: чем подход штатов отличается от требований HIPAA?

В Правилах конфиденциальности HIPAA есть положение «Безопасная гавань» (Safe Harbor), которое описывает, как можно публиковать медицинские данные. Там установлены конкретные ограничения:

  • в датах можно указывать только год, без месяца и дня;

  • почтовый индекс можно публиковать только по первым трём цифрам и только в том случае, если суммарное население всех индексов с такими первыми тремя цифрами превышает 20 000 человек;

  • если население меньше 20 000, вместо реального индекса указывается 00000;

  • из данных нужно убрать явные идентификаторы — имена, номера социального страхования, точные адреса и т.п.

Теперь сравним с практикой штатов. Среди тех, кто публикует данные о госпитализациях на уровне штата, лишь три штата делают это по стандартам HIPAA; остальные 30 этим стандартам не следуют. Многие из них включают более детальные сведения — например, указывают не только год рождения пациента, но и месяц. Другие, наоборот, дополнительно обобщают данные по сравнению с HIPAA: используют возрастные интервалы вместо точного возраста и/или публикуют диапазоны почтовых индексов, а не конкретные значения.

Предыстория

Под «повторной идентификацией» медицинских данных понимают ситуацию, когда удаётся точно и однозначно связать конкретного человека с его медицинской записью. Такие эксперименты уже проводились и раньше.

В 1997 году я узнала, что медицинская информация о госслужащих станет доступна довольно широкому кругу лиц. Владельцы данных убрали явные идентификаторы — имя, адрес и т.п. — в соответствии с тогдашними стандартами деидентификации. Однако в базе остались дата рождения, пол и пятизначный почтовый индекс. Простые прикидки заставили задуматься: в году 365 дней, пол — один из двух, средняя продолжительность жизни ~78 лет. Если перемножить, получается около 56 940 возможных комбинаций. При этом в среднем в одном пятизначном почтовом индексе проживает всего около 25 000 человек. Значит, многие комбинации «дата рождения + пол + индекс» будут уникальными.

Чтобы проверить гипотезу, нужно было найти конкретного человека в базе. Тогдашний губернатор Массачусетса Уильям Уэлд был идеальным примером: его дата рождения и домашний адрес в Кембридже были в открытом доступе. За 20 долларов я купила список избирателей Кембриджа, где для 54 805 зарегистрированных избирателей были указаны имя, адрес, дата рождения, пол и история голосования. Оказалось, что сочетание «дата рождения + пол + почтовый индекс» Уэлда уникально и в списке избирателей, и в медицинской базе, что позволило однозначно сопоставить его личность с записью в формально обезличенном файле о госслужащих.

Одна новость — и вся ваша история болезней на ладони: опыт США

История быстро дошла до Вашингтона, округ Колумбия, где как раз обсуждались вопросы конфиденциальности в здравоохранении в рамках будущего закона HIPAA. Этот эксперимент по повторной идентификации заметно повлиял на формирование правил конфиденциальности HIPAA, и меня упомянули в преамбуле. Обсуждение случая Уэлда также привело к усилению защиты демографических данных в регулировании по всему миру.

После этого было проведено ещё несколько экспериментов по повторной идентификации. Сразу после истории с Уэлдом я сделала множество подобных проектов, но страх, шок, непонимание и отсутствие финансирования привели к тому, что результаты так и не были опубликованы. Например, в деле «Университет Южного Иллинойса против Департамента здравоохранения» сам Департамент признал, что я успешно повторно идентифицировала детей по комбинации {тип рака, почтовый индекс, дата постановки диагноза}. Суд в решении похвалил мой профессионализм, адвокаты называли меня «богиней повторной идентификации», но одновременно суд засекретил детали методики и запретил её публикацию. То же самое произошло и с другими ранними работами по повторной идентификации данных опросов и фармацевтических исследований.

В тех немногих случаях десять лет назад, когда эксперименты удавалось довести до публикации, журналы всё равно часто отказывали — и не из-за качества науки. Издания по информатике не хотели публиковать работы, где описывалась только атака с повторной идентификацией, без готового технического «лекарства», хотя авторы и утверждали, что сами такие атаки должны стимулировать создание новых технологий защиты. Журналы по политике в области здравоохранения, напротив, боялись, что публикация таких результатов нанесёт удар по существующей практике обмена данными, хотя именно рост масштабов обмена за счёт технологий требует их пересмотра. В итоге даже пример с Уэлдом и анализ демографической уникальности, которые позже повлияли на глобальное регулирование конфиденциальности, были первоначально отклонены более чем 20 научными журналами.

Финансирование тоже давали неохотно. Десять лет назад гранты на эксперименты по повторной идентификации обычно выдавали только при условии, что результаты покажут отсутствие риска или что все проблемы можно будет «закрыть» некой модной теоретической технологией, находящейся в разработке. Если ожидался неудобный результат о реальных рисках, деньги, как правило, не выделялись — а без них трудно провести систематические исследования.

Отсутствие опубликованных данных сыграло на руку критикам, которые стремились убедить общество, что рисков почти нет (иногда, доходя до сильных искажений фактических сведений о повторной идентификации).

Спустя десять лет Эль Эмам и соавторы провели обзор литературы и нашли всего 14 опубликованных атак с повторной идентификацией. Из них 11 они исключили, посчитав, что это лишь демонстрационные или оценочные атаки исследователей, а не «реальные» повторные идентификации, проверяемые на практике. В эту группу они, например, отнесли работу Нараянана и Шматикова, которые показали, как можно повторно идентифицировать пользователей по набору анонимизированных историй просмотров Netflix, сопоставляя их с публичными (идентифицированными) отзывами о фильмах. Хотя Эль Эмам и коллеги в своём обзоре фактически «отмахнулись» от этого эксперимента, он вылился в расследование Федеральной торговой комиссии США и судебный иск, который Netflix затем урегулировал.

Из трёх оставшихся, признанных «реальными» повторными идентификациями, две Эль Эмам и соавторы отвергают как не соответствующие стандартам HIPAA. Оставшееся исследование они, напротив, представляют как выполненное по требованиям HIPAA и демонстрирующее очень низкий риск повторной идентификации. Однако в этом эксперименте авторы по сути только заново воспроизвели мой старый эксперимент времён до HIPAA, но уже на данных, отредактированных по HIPAA. Работа была чрезмерно зациклена на одном конкретном сценарии и не учитывала другие возможные стратегии атак, которые могли бы оказаться успешнее. Это серьёзный недостаток, который Эль Эмам и коллеги не учитывают. Тем не менее их обзор подчёркивает: нам по-прежнему не хватает целостного понимания реальных рисков повторной идентификации.

Такое бедное состояние науки о рисках повторной идентификации в мире, где объём данных и их доступность постоянно растут, сегодня вызывает ещё больше тревоги, чем десять лет назад. Отсюда логичный вопрос: можно ли сейчас, при текущем уровне технологий и открытости данных, повторно идентифицировать пациентов по медицинским данным штатов?

Это была только вводная часть

В премиум-версии материала показан сам эксперимент: как новости, ZIP-коды и дата рождения превратились в имена и диагнозы, что ответили пациенты по телефону и почему после этого штаты срочно переписывали законы о конфиденциальности.

Поддержите автора

Показать полностью 1
11

Как вероятность 1 к 73 000 000 стала приговором для матери двух младенцев: дело Салли Кларк

Ноябрьским вечером 1999 года присяжные собрались произнести вердикт в зале Честерского суда. На скамье подсудимых – 35-летняя адвокат из Чешира по имени Салли Кларк, мать двоих умерших младенцев. За окном холодно, а внутри – мёртвая тишина. Только что эксперт-педиатр сэр Рой Мидоу спокойно сообщил ошеломляющую цифру: вероятность того, что две здоровые дети из одной благополучной семьи скончались естественной смертью, равна «примерно одному шансу из 73 миллионов». Присяжные переглянулись: такое случается реже, чем раз в столетие. Казалось, сама статистика шепчет обвинение. Через несколько часов Салли услышит слово «виновна» – и звук захлопывающейся тюремной двери на долгие годы.

Два трагических случая легли в основу процесса. В декабре 1996 года первый сын Салли, 11-недельный Кристофер, внезапно перестал дышать в своей колыбели. Врачи назвали причиной «синдром внезапной детской смерти» (СВДС), то есть непредсказуемая гибель младенца без видимых причин. Горе молодых родителей не укладывалось в голове, но они старались жить дальше. Спустя год, в январе 1998-го, случилось немыслимое: умер второй сын, 8-недельный Гарри, тоже внезапно, во сне. Два случая СВДС в одной семье – статистическая редкость. Полиция, получив сигнал от патологоанатома, заподозрила худшее. Салли и её мужа арестовали по обвинению в убийстве младенцев, хотя ни прямых улик, ни мотива, ни признаков насилия не находили. Отца вскоре отпустили, а вот мать предали суду: против неё играла сама невероятность двух несчастий подряд.

Главным козырем обвинения стал профессор Рой Мидоу – авторитетный педиатр, много лет изучавший случаи детской смерти. Его свидетельство произвело эффект разорвавшейся бомбы. Мидоу вывел, что для семьи вроде Кларков (благополучной, некурящей, с достатком) шанс потерять ребёнка от СВДС – около 1 к 8 543. Такие случаи крайне редки. А вероятность, что несчастье случится дважды, он предложил найти перемножением: 1/8543 × 1/8543 ≈ 1/73 000 000.

«Один на 73 миллиона», – повторил эксперт, сравнив эту удачу с тем, чтобы угадать победителя скачек с коэффициентом 80:1 четыре года подряд.

Суд притих – число подействовало завораживающе. В сознании присяжных эта астрономическая дробь превращалась в уверенность: не может же такое случиться случайно, значит, перед нами убийца.

Однако за громкой цифрой скрывалась ловушка условной вероятности. Мидоу, сам того не желая, подвёл присяжных к опасной логической подмене. Он вычислил вероятность два ребёнка умерли естественно, приняв невиновность матери, но это число прозвучало как вероятность невиновности самой матери. В зале суда произошло то самое «транспонирование условий», которое называют прокурорской ошибкой: шанс наблюдать такое стечение обстоятельств превратился в шанс оправдать обвиняемую.

Между тем это вовсе не одно и то же. Сказать «шанс двух случайных смертей – 1 к 73 миллионам» – не значит сказать «шанс невиновности – 1 к 73 миллионам». Чтобы оценить, виновна Салли или нет, нужно сопоставить две конкурирующие версии: малыши погибли сами по себе или их убили. Цифра от Мидоу касалась лишь первой половины этой дилеммы и ничего не говорила о второй. Присяжные же, услышав про 73 миллиона, могли решить, что альтернативы невиновности попросту нет.

Не успел суд понять эту подмену, как с цифрой случилась ещё одна метаморфоза. Статистика Мидоу основывалась на допущении, что смерти двух детей были независимы – словно молния никогда не бьёт дважды в одно место. Это ключевое условие позволило перемножить вероятности, но именно оно крайне сомнительно. Есть веские причины полагать, что случаи СВДС внутри одной семьи не независимы. Неизвестные генетические факторы, особенности здоровья или обстановки – всё это может повысить риск повторного трагического исхода. Проще говоря, если в семье уже случилась детская смерть, вероятность второго случая вовсе не такая ничтожная, как при расчёте «с чистого листа». Сам профессор Мидоу не учёл этого: он сложил все лучшие условия семьи (благосостояние, заботливые родители, отсутствие вредных привычек) и на их основе вычислил вероятность СВДС, но те же самые факторы снижают и вероятность криминала. Семья, где дети растут в любви и достатке, – группа низкого риска не только для синдрома внезапной смерти, но и для насильственного убийства. Эта логическая ловушка позднее была подчёркнута независимыми экспертами: благополучие Кларков отнюдь не превращало версию убийства в более вероятную, как могло показаться присяжным.

Возвращаясь к той самой цифре, стоит спросить: даже если бы шанс двух случайных смертей равнялся 1 к 73 000 000, насколько уверенно можно было бы считать Салли убийцей? Представим на минуту альтернативу: вместо трагедии по воле случая дети погибли от рук матери. Какова вероятность двойного младенческого убийства в столь же благополучной семье? Таких данных нет в простом эпидемиологическом справочнике, но логично, что матерей, убивших двоих детей, – исчезающе мало. Если честно попытаться численно сравнить обе гипотезы, может статься, что двойное убийство встречается ещё реже, чем двойной СВДС. Именно это по сути и выяснилось позднее. В 2002 году встревоженное профессиональное сообщество статистиков выступило с открытым письмом: Королевское статистическое общество Великобритании прямо указало, что цифра «1 к 73 миллионам» не имеет под собой надёжной основы, и подчеркнуло: независимость двух случаев СВДС – недоказанное и, скорее всего, неверное предположение. А в 2004-м профессор математики Рэй Хилл проанализировал реальные данные по повторным детским смертям и пришёл к выводу: пережив одну потерю, семья входит в группу риска, где шанс второго СВДС повышается в 5–10 раз. Произведя более корректные расчёты, он показал, что даже без всяких новых улик вероятность невиновности Салли Кларк оставалась очень высокой. Другими словами, при сопоставлении двух редчайших сценариев – случайной гибели детей и намеренного убийства – первый оказывался по меньшей мере не менее вероятным. Статистика, задумавшаяся над альтернативой, уже не рисовала облик чудовища. Но, к несчастью, эти рассуждения прозвучали слишком поздно.

В 1999 году суд присяжных был очарован цифрами. Огромное число «1 из 73 000 000» подействовало гипнотически. Позднее Апелляционный суд Англии по образному выражению вспомнит про «математику-колдуна, околдовывающего искателя истины», но тогда, в процессе Салли Кларк, эффект больших чисел едва ли не подавил здравое сомнение. Присяжные не были статистиками – да от них этого и не требовалось. Им достаточно было услышать бесстрастный голос эксперта с красивым расчётом, чтобы ощущение невероятности переросло в убеждённость. Ни одно слово защитника уже не могло поколебать стройность 73-миллионной дроби.

Вердикт был вынесен 9 ноября 1999 года: виновна в убийстве обоих сыновей, с обязательным наказанием – пожизненным заключением. Салли отправилась в тюрьму, став изгоем: сокамерницы травили её как детоубийцу, пресса клеймила чудовищем в облике матери. Её муж, тоже юрист, разорился в попытках добиться пересмотра дела. Лишь в 2000 году, когда первые эмоции улеглись, тема статистической ошибки робко вышла на свет. Нашлись учёные, указавшие на прокурорскую ошибку и недопустимость превращать редкость события в доказательство вины.

Статья Нила Килинга, описывающая взгляды профессора Рэя Хилла на дело Салли.

Статья Нила Килинга, описывающая взгляды профессора Рэя Хилла на дело Салли.

В октябре 2000-го состоялось первое апелляционное слушание, где защита попыталась оспорить приговор, указав на непродуманность «73-миллионного» аргумента. Однако судьи тогда оставили приговор без изменений. В их глазах, помимо статистики, имелись и другие косвенные доводы против Кларк – например, не до конца понятные результаты вскрытия младшего ребёнка. Апелляция отметила: да, цифры могли ввести присяжных в заблуждение, но и без них доказательства выглядят убедительно. Салли осталась за решёткой.

Прошло ещё два года борьбы, прежде чем выплыла на поверхность скрытая ранее улика, перевернувшая ход истории. Оказалось, что ещё в 1998 году патологоанатом взял образцы крови второго малыша – Гарри – и обнаружил в них опасную бактерию Staphylococcus aureus. Эта находка могла означать инфекцию, способную вызвать смерть ребёнка естественным путём. Улика почему-то затерялась в деле: ни суд, ни эксперты о ней не знали, хотя защита напрямую спрашивала об анализах крови.

Золотистый стафилококк

Золотистый стафилококк

Когда правда вскрылась, комиссия по пересмотру уголовных дел немедленно направила дело Кларк в Апелляционный суд повторно. На слушаниях зимой 2003 года прозвучало уже два новых мотива к пересмотру приговора. Во-первых, скрытое медицинское доказательство: если Гарри умер от инфекции, никакого убийства не было и в помине. Во-вторых, к тому моменту и сами судьи осознали, насколько непрочна была статистическая основа обвинения. В решении суда 11 апреля 2003 года отметили, что свидетельство профессора Мидоу не должно было предлагаться присяжным в том виде, в каком прозвучало.

«Громкие цифры 1 к 73 миллионам, подогретые ярким примером с выигрышем на скачках, вероятно, сильно повлияли на умы присяжных, несмотря на все усилия судьи умалить их значение», – констатировали апелляционные судьи.

Вердикт 1999 года был отменён, Салли Кларк – оправдана и освобождена в зале суда после более чем трёх лет тюрьмы. Но радости не наступило: «Тут нет победителей, – сказала она журналистам. – Мы просто счастливы, что наш кошмар наконец закончился».

Салли Кларк

Салли Кларк

Кошмар действительно оставил тяжёлый след. Салли так и не смогла оправиться от тюремных лет: пережитое обернулось тяжёлой депрессией и зависимостью. В 2007 году, в возрасте 42 лет, Салли Кларк скончалась от отравления алкоголем – фактически, сломленная испытанием, которое ей выпало вынести. Тем не менее история её дела не прошла даром для системы правосудия. Напротив, «дело Салли Кларк» стало поворотным уроком для британских судов. После неё несколько аналогичных приговоров (в том числе дел, где фигурировал всё тот же профессор Мидоу) были оперативно пересмотрены, а обвиняемые – освобождены.

Медицинское сообщество пересмотрело подходы к расследованию детских смертей, усилив требования к экспертизе. Статистики заговорили с юристами: Королевское статистическое общество добилось, чтобы эксперты впредь крайне осторожно обращались с вероятностями в зале суда. Главное – признали хрупкость чисел вне контекста. Красивая оценка шанса сама по себе не может служить доказательством. Извлечённая из учебника вероятность должна звучать только вместе с оговорками, условиями и альтернативами. И уж точно нельзя напрямую превращать редкость события в уверенность в чьей-то виновности.

История Салли Кларк – трагическое напоминание о том, как легко очарование математики может обернуться заблуждением. Большое число, прозвучавшее как приговор, в итоге оказалось лишь миражом – и слишком поздно рассеялось, разрушив несколько жизней.

  • И эта история — лишь начало. Ошибки в обращении с числами не раз оказывались в центре судебных процессов. Уже вышла вторая статья, посвящённая делу People v. Collins из Калифорнии, где вероятности умножались на доске прямо на глазах у присяжных, превратив зал суда в лотерейный зал. Схожая завораживающая цифра — и вновь вопрос: где кончается статистика и начинается заблуждение?

  • Впереди ещё целая серия разборов — от ДНК-экспертиз в Британии до алгоритмов ИИ в американских судах. Часть этих историй будет доступна только по подписке Премиум: там мы подробно поговорим о том, как числа и формулы могут как помогать, так и искажать правосудие.

  • Подписка на телеграм-канал - это тоже важная форма поддержки!

Источники:

  1. R v Clark (Sally). Решение Апелляционного суда Англии и Уэльса от 11 апреля 2003 г. (№ 200203824 Y3, [2003] EWCA Crim 1020).

  2. Royal Statistical Society. Statement on Statistical Evidence in Court, October 23, 2001; Letter to the Lord Chancellor (Statistics and Cases), January 23, 2002.

  3. Ray Hill. “Multiple sudden infant deaths – coincidence or beyond coincidence?” Paediatric and Perinatal Epidemiology, vol. 18, 2004, pp. 320–326.

  4. Sara Gaines, David Pallister. “Sally Clark’s death accidental, coroner rules.” The Guardian, 7 November 2007.

Показать полностью 3
51

Гипотеза пала: 3+3 6! Один узел перечеркнул “порядок” во вселенной математики

В 1876 году Питер Гатри Тейт предложил измерять то, что он называл «запутанностью» узлов.

Шотландский математик, во многом предвосхитивший современную теорию узлов, искал практический способ отличать один узел от другого — задача, мягко говоря, непростая. В математике узел — это замкнутая верёвка без свободных концов. Два узла считают одинаковыми, если их можно плавно деформировать — тянуть, крутить — не разрезая, так чтобы один превратился в другой. По одному лишь рисунку понять это трудно: узел, выглядящий «страшно» сложным, может оказаться той же самой простой окружностью.Тейт предложил такой критерий различия. Разложим узел на плоскости и посмотрим на точки самопересечения. В одной из таких точек «перевернём» пересечение: мысленно разрежем, поменяем местами верхнюю и нижнюю нити и снова «склеим». Повторяя операцию столько раз, сколько нужно, можно получить незавязанный круг. Минимальное число таких «переворотов» он назвал мерой незавязанности — сегодня это известно как число развязывания узла.

Если у двух узлов эти числа различаются, значит, узлы точно не эквивалентны. Однако вскоре Тейт понял, что введённая им величина рождает больше новых загадок, чем снимает старых.

«Я так увлёкся этой темой, — писал он в письме другу, физику Джеймсу Клерку Максвеллу, — что боюсь либо что-то упустить, либо, наоборот, переоценить то, что любому другому покажется слишком простым».

Если Тейт чего-то недоглядел, то не он один: вот уже полтора века число развязывания ставит теоретиков узлов в тупик. Известно, что по идее оно должно полностью характеризовать узел — «возможно, самая базовая мера», как говорит Сьюзан Хермиллер из Небраски. Но на практике это число часто невероятно трудно вычислить, и его связь с «сложностью» узла неочевидна.

Чтобы прорваться в понимании, в начале XX века математики выдвинули простую гипотезу о том, как ведёт себя число развязывания при соединении двух узлов (их сумме). Докажи её — и появится универсальный способ находить это число для любого узла, то есть простой, конкретный «измеритель» сложности.

Шотландский физик и математик Питер Гатри Тейт начал систематическое изучение того, что впоследствии стало одной из важнейших проблем теории узлов: классификации узлов.

Шотландский физик и математик Питер Гатри Тейт начал систематическое изучение того, что впоследствии стало одной из важнейших проблем теории узлов: классификации узлов.

Почти сто лет искали доказательство — и безуспешно: ни подтверждений, ни опровержений.

И вот в июньской работе Хермиллер и её соавтор Марк Бриттенхэм нашли пару узлов, чья сумма развязывается легче, чем предсказывала гипотеза. Значит, гипотеза неверна. Более того, их пример позволил построить бесконечно много других контрпримеров.

«Когда статья вышла, я буквально ахнула», — сказала Эллисон Мур из Университета Содружества Виргинии. По её словам, результат показывает, что число развязывания ведёт себя «капризно и непредсказуемо», и тема явно далека от полного понимания.

Развязывание узлов и великая неизвестность

Ещё как минимум с 1937 года немецкий математик Хильмар Вендт пытался понять, что происходит, когда два узла «складывают» — берут одну и ту же верёвку, завязывают в ней оба узла и затем замыкают концы. Такой объект называют суммой узлов. Вендт выдвинул догадку: число развязывания у суммы должно равняться сумме чисел развязывания исходных узлов.

На интуитивном уровне это звучит разумно. Пусть у левого узла число развязывания 2, у правого — 3. Значит, есть последовательность из двух изменений пересечений, которая развязывает левую часть, и последовательность из трёх — для правой. Если выполнить их подряд, весь комбинированный узел распутается за 2+3=5 шагов.

Однако из этого следует лишь верхняя оценка: число развязывания суммы не больше 5. Может оказаться, что найдётся более хитрая последовательность изменений, которая распутает весь узел быстрее, чем «по частям». Иными словами, сумма узлов способна иметь число развязывания меньше, чем сумма чисел её составляющих.

Чтобы подтвердить аддитивность, нужно было либо найти пример суммы узлов, которая распутывается быстрее, чем «по частям», либо доказать, что такого примера не бывает. И вот тут все застревали — непонятно, с чего вообще начинать.

Одна из причин: узел на плоскости задаётся диаграммой, а у одного и того же узла их может быть бесчисленно много. От выбора диаграммы зависит, где именно расположены пересечения. Чтобы получить самую короткую последовательность «переворотов» пересечений, нередко надо сначала подобрать подходящую диаграмму — и это далеко не всегда привычное изображение узла.

«Способов видоизменить диаграмму до применения изменения пересечения — немыслимо много, — говорит Марк Бриттенхэм. — По крайней мере на старте мы вовсе не контролируем, насколько сложной окажется нужная схема».

В 1985 году Мартин Шарлеманн сделал первый ощутимый шаг: он доказал, что если у обоих узлов число развязывания равно 1, то у их суммы оно всегда равно 2. «Это сильно повысило правдоподобие всей гипотезы», — отмечает Чарльз Ливингстон из Университета Индианы.

Сьюзан Хермиллер (слева) и Марк Бриттенхэм опровергли гипотезу о узлах, выдвинутую несколько десятилетий назад, что усложнило понимание этих, казалось бы, простых объектов для математиков.

Сьюзан Хермиллер (слева) и Марк Бриттенхэм опровергли гипотезу о узлах, выдвинутую несколько десятилетий назад, что усложнило понимание этих, казалось бы, простых объектов для математиков.

Итоги тех работ вселяли надежду, что «мир узлов» поддаётся упорядочению. Дело в том, что любой узел можно собрать из меньшего набора базовых, «простых» узлов. А если гипотеза аддитивности верна, то, зная числа развязывания для этих простых кирпичиков, мы автоматически знаем их для всех составных узлов: нужные сведения как бы «перетекают» из малого набора данных ко всем объектам.

«Мы очень хотели, чтобы гипотеза оказалась правильной, — отмечает Арунима Рэй из Мельбурна, — ведь это означало бы, что в этой области царит порядок».

Позднее результат Шарлеманна удалось распространить на ещё несколько семейств узлов, но оставалось непонятно, охватывает ли он вообще все случаи. Тогда Бриттенхэм и Хермиллер подключили вычислительную мощь — задействовали несколько компьютеров и перешли к масштабным переборам.

Скрытый интернет

Около десяти лет назад Хермиллер и Бриттенхэм запустили большой проект: с помощью вычислений собрать максимум сведений о числе развязывания.

Для этого они использовали программу SnapPy, которая с опорой на тонкие геометрические методы проверяет, соответствуют ли две диаграммы одному и тому же узлу. За несколько лет база SnapPy сильно выросла и научилась распознавать почти 60 000 различных узлов — как раз то, что им было нужно.

Их подход был таким: взять один сложный узел и по очереди выполнить все возможные изменения пересечений, получая целое семейство новых узлов. Затем с помощью SnapPy определить каждый из них — и повторить процедуру снова.

Так они обработали миллионы диаграмм, охватывающих сотни тысяч узлов, собрав огромный банк данных о последовательностях «развязываний» и вычислив верхние оценки числа развязывания для тысяч случаев. Проект требовал серьёзных ресурсов: учёные подключились к суперкомпьютерам Университета Небраски, а ещё запускали код на подержанных ноутбуках, купленных на аукционах. В итоге управляли десятками машин. «У нас получилась почти домашняя вычислительная сеть, — вспоминает Бриттенхэм, — где данные буквально переносили с компьютера на компьютер, шагая между ними».

Тейт составил таблицу узлов и описал их свойства. Эта страница взята из статьи 1885 года.

Тейт составил таблицу узлов и описал их свойства. Эта страница взята из статьи 1885 года.

Десять с лишним лет их программа крутилась на фоне. За это время некоторые из разношёрстных компьютеров перегревались и даже воспламенялись. «Один искрил, — вспоминает Бриттенхэм. — Было забавно». (В итоге всех «ветеранов» почтенно списали.)

Осенью 2024-го внимание Бриттенхэма и Хермиллер привлекла статья о неудачной попытке опровергнуть аддитивность с помощью машинного обучения. Они решили, что для такой задачи ML — не лучший инструмент: если контрпример и существует, это настоящая «иголка в стоге сена», а машинное обучение умеет скорее вылавливать закономерности, чем штучные редкости. Зато эта работа укрепила их в мысли, что их собственная, продуманная вычислительная сеть как раз и может найти такую иголку.

Узлы, которые «связывают»

Исследователи догадались использовать собранные ими последовательности развязывания, чтобы охотиться за возможными контрпримерами к аддитивности.

Представьте два узла с числами развязывания 2 и 3; мы рассматриваем их сумму. Сделав одно изменение пересечения, получаем «промежуточный» узел. Если верна аддитивность, исходная сумма должна требовать 5 шагов, а у нового, после первого шага, должно остаться 4.

Но если уже известно, что этот промежуточный узел развязывается за 3 шага, значит, исходную сумму можно распутать за 4, а не за 5 — и гипотеза рушится.

«У нас есть эти промежуточные узлы, — говорит Бриттенхэм. — Чему они могут нас научить?»

И тут как нельзя кстати пригодилась их десятилетняя база: огромный каталог верхних оценок числа развязывания для тысяч узлов, уже работающий на их ноутбуках.

Учёные стали попарно «складывать» узлы и искать кратчайшие последовательности их развязывания. Приоритет отдали тем суммам, для которых известны лишь грубые оценки — с большим разрывом между нижней и верхней границами числа развязывания. Даже так перечень кандидатов оказался колоссальным — «десятки миллионов, а то и сотни миллионов», по словам Бриттенхэма.

Несколько месяцев их программа последовательно меняла пересечения, а получившиеся узлы сверяла с собственной базой. И вот поздней весной Бриттенхэм, как обычно, заглянул в выходные файлы — и увидел строку: «Сумма соединений нарушена». Это сообщение они предусмотрели в коде на случай контрпримера, но не рассчитывали когда-нибудь его увидеть.

Сначала они не поверили. «Первая мысль — у нас ошибка в программе», — вспоминает Бриттенхэм. «Мы бросили всё, — говорит Хермиллер. — Еда и сон только мешали».

Однако проверка показала: всё верно. Они даже завязали на верёвке соответствующий узел и вручную распутали его — для полной уверенности.

Контрпример оказался настоящим.

Контрпример, найденный Бриттенхэмом и Хермиллер, — это сумма двух копий торового узла T(2,7). Такой узел можно получить, если две пряди сделать с семью полуперекрутами (то есть обернуть их друг вокруг друга три с половиной раза) и затем замкнуть концы; зеркальный вариант получается, если «закручивать» в противоположную сторону.

И у T(2,7), и у его зеркального отражения число развязывания равно 3. Но их сумма, как показала программа исследователей, распутывается не за 6 шагов, как предсказывала аддитивность, а всего за 5 — то есть быстрее, чем ожидалось.

«Контрпример удивительно простой, — отмечает Мур. — Всё упирается в непредсказуемость одного-единственного шага — изменения пересечения».

На основе находки Бриттенхэм и Хермиллер построили бесконечное семейство новых контрпримеров — фактически охватив почти все узлы, получаемые наматыванием двух нитей с последующим склеиванием.

Раз гипотезу аддитивности окончательно опровергли, перед теорией узлов открывается целая полоса новых вопросов и направлений. Некоторых это огорчает: структуры в «мире узлов» оказалось меньше, чем хотелось. «Число развязывания ведёт себя не так хорошо, как мы надеялись», — говорит Рэй. «Немного грустно».

Но вместе с тем интрига только растёт. «Похоже, теория узлов куда более запутанна и богата неизвестным, чем мы думали ещё совсем недавно», — говорит Ливингстон.

Пока непонятно, в чём именно эта дополнительная сложность. Тщательно изучив свой пример, Бриттенхэм и Хермиллер так и не смогли объяснить, почему именно он ломает аддитивность, тогда как другие — нет. Разобравшись с этим, математики, возможно, поймут, что делает одни узлы «сложнее», а другие — проще.

«Я до сих пор не могу ответить на этот, казалось бы, простой вопрос о числе развязывания, — признаётся Мур. — И это лишь подогревает интерес».

Показать полностью 6
1

50% американцев не читают книги, 35% не знают математики: тревожные цифры эпохи цифровых технологий2

На первый взгляд, вопрос о том, что такое интеллект, кажется простым. Оксфордский словарь определяет его как «способность понимать». Однако это определение поднимает важный вопрос, особенно актуальный в современном мире: что происходит, если наша способность применять этот интеллект на практике уменьшается? Все больше данных свидетельствует о том, что за последнее десятилетие человеческий интеллект действительно начал снижаться.

Конечно, за такой короткий промежуток времени фундаментальная биология человеческого мозга не изменилась. Однако результаты различных тестов показывают, что способность среднего человека рассуждать и решать новые задачи достигла пика в начале 2010-х годов и с тех пор неуклонно снижается.

Когда были опубликованы последние результаты международного теста PISA (программа ОЭСР для оценки знаний 15-летних школьников в чтении, математике и естественных науках), основное внимание было уделено влиянию пандемии Covid-19 на образование. Однако это скрыло более долгосрочную и широкомасштабную тенденцию к ухудшению.

Долгосрочность этой тенденции проявляется в том, что результаты по всем трем предметам достигли пика примерно в 2012 году. Во многих случаях снижение между 2012 и 2018 годами было более значительным, чем в годы, затронутые пандемией. А широкомасштабность заключается в том, что это снижение способности к рассуждению и решению проблем наблюдается не только среди подростков. Взрослые демонстрируют аналогичную картину: в последнем обновлении оценки навыков взрослых ОЭСР снижение заметно во всех возрастных группах.

Несмотря на важность этой темы, долгосрочных исследований человеческого внимания или умственных способностей проводится surprisingly мало. Однако есть редкое исключение: с 1980-х годов исследование «Monitoring the Future» ежегодно спрашивает 18-летних, испытывают ли они трудности с мышлением, концентрацией или изучением нового. Доля выпускников школ, сообщающих о таких трудностях, оставалась стабильной в 1990-х и 2000-х годах, но начала резко расти в середине 2010-х.

Этот переломный момент примечателен не только тем, что он совпадает с ухудшением результатов тестов на интеллект и рассуждение, но и тем, что он совпадает с другим глобальным изменением: нашей изменившейся связью с информацией, которая теперь постоянно доступна в интернете.

Частично это может быть результатом перехода от текста к визуальным медиа — сдвига в сторону «пост-грамотного» общества, погруженного в экраны. Снижение интереса к чтению действительно наблюдается: в 2022 году доля американцев, прочитавших хотя бы одну книгу за год, упала ниже 50%.

Однако особенно поражает то, что на фоне этого мы видим снижение способности применять математические навыки и другие формы решения проблем в большинстве стран. Например, доля взрослых, которые не могут «использовать математические рассуждения для оценки достоверности утверждений», в среднем составляет 25% в странах с высоким уровнем дохода и 35% в США.

Таким образом, речь идет не только о снижении интереса к чтению, но и о более широкой эрозии способности человека к умственной концентрации и применению знаний.

Большинство дискуссий о влиянии цифровых технологий на общество сосредоточено на росте популярности смартфонов и социальных сетей. Однако изменение способности человека к сосредоточенному мышлению совпадает с чем-то более фундаментальным: сдвигом в нашей связи с информацией.

Мы перешли от ограниченного числа веб-страниц к бесконечным, постоянно обновляемым лентам и непрерывному потоку уведомлений. Мы больше не тратим столько времени на активный поиск информации и взаимодействие с людьми, которых знаем, а вместо этого получаем лавину контента. Это представляет собой переход от самостоятельного поведения к пассивному потреблению и постоянному переключению контекста.

Исследования показывают, что активное и осознанное использование цифровых технологий часто безвредно или даже полезно. Однако те модели поведения, которые стали популярны в последние годы, негативно влияют на нашу способность обрабатывать вербальную информацию, концентрацию, рабочую память и самоконтроль.

Хорошая новость заключается в том, что базовые интеллектуальные способности человека, несомненно, остаются неизменными. Однако результаты зависят как от потенциала, так и от его реализации. Для многих из нас цифровая среда препятствует последнему.

Показать полностью 5
1

Лёд, слёзы и парадокс Борда: почему серебро ЧМ-1995 было отвергнуто фигуристкой?

Чемпионат мира по фигурному катанию 1995 года в Бирмингеме стал не просто спортивным событием, а настоящей математической загадкой. Четыре фигуристки, три программы и одна система подсчёта очков, которая нарушила все ожидания. Когда Мишель Кван заняла третье место в произвольной программе, это неожиданно изменило судьбу подиума: Сурия Бонали, которая уже завершила свои выступления, оказалась на втором месте, обойдя Николь Бобек. Но самое удивительное — Бонали отказалась подниматься на пьедестал, считая, что серебро ей не принадлежит. Как математика перевернула итоги соревнований? Почему система ранжирования нарушила принцип независимости от неактуальных альтернатив? И как этот случай навсегда изменил фигурное катание?

Четыре фигуристки и одна загадка

Ключевыми персонажами этой истории стали четыре фигуристки:

  • Лу Чэнь из Китая,

  • Сурия Бонали из Франции,

  • Николь Бобек из США,

  • Мишель Кван, также представлявшая США.

Марка, посвященная Лу Чень

Марка, посвященная Лу Чень

К моменту выступления Кван лидировала Чэнь, за ней следовала Бобек, а на третьем месте была Бонали. Кван выступила достойно, но недостаточно хорошо, чтобы претендовать на медаль, заняв четвёртое место. Однако её результат неожиданно привёл к тому, что Бонали опередила Бобек и заняла второе место. Возникает вопрос: как подобное могло произойти, если обе фигуристки уже выступили?

Структура соревнования

Соревнование состояло из трёх программ:

  1. Квалификационная произвольная программа — не имела значения для рассматриваемого случая.

  2. Короткая программа.

  3. Произвольная программа.

Победитель короткой программы (Бобек) получал пол-очка, второе место — одно очко, третье (Чэнь) — полтора очка, четвёртое (Бонали) — два очка и так далее.

Произвольная программа имела двойной вес: победитель получал одно очко, второе место — два очка, третье — три и так далее. Общий итог определялся суммой очков — чем меньше, тем лучше.

Как Кван всё изменила

Перед выступлением Кван ситуация была следующей:

  • Чэнь имела 1,5 очка за короткую программу и лидировала в произвольной, в сумме — 2,5 очка.

  • Бобек набрала 0,5 очка в короткой программе и шла третьей в произвольной — всего 3,5 очка.

  • Бонали заработала 2 очка в короткой программе и занимала второе место в произвольной — 4 очка в сумме.

Кван своим выступлением заняла третье место, сместив Бобек на четвёртую позицию и добавив ей одно очко. Это увеличило общий результат Бобек до 4,5 очков и переместило её на третье место, уступив Бонали серебро.

Бонали отказывалась подняться на пьедестал (единственный случай в истории), не соглашаясь с результатами соревнований, но после уговоров президента ИСУ Паульсена поднялась и приняла медаль, но затем сразу её сняла

Бонали отказывалась подняться на пьедестал (единственный случай в истории), не соглашаясь с результатами соревнований, но после уговоров президента ИСУ Паульсена поднялась и приняла медаль, но затем сразу её сняла

Граф Борда и его роль

Для лучшего понимания ситуации стоит обратить внимание на граф Борда, который используется при ранжировании альтернатив в системе подсчёта Борда. Граф Борда — это ориентированный граф, в котором вершины соответствуют альтернативам (в данном случае — фигуристкам), а рёбра отражают предпочтения одного варианта над другим на основании голосов судей или оценок. Вес рёбер показывает количество голосов в пользу одной альтернативы над другой.

В случае с чемпионатом мира по фигурному катанию 1995 года граф Борда отражал взаимные предпочтения между фигуристками на основе их мест в короткой и произвольной программах. Когда Кван заняла третье место в произвольной программе, структура предпочтений изменилась, что привело к изменению порядка следования Бобек и Бонали в итоговом графе.

Граф Борда демонстрирует одно из слабых мест системы ранжирования, так как добавление новой альтернативы (результата Кван) влияет на существующий порядок предпочтений между уже оценёнными участниками. Это иллюстрирует нарушение принципа независимости от неактуальных альтернатив (IIA).

Почему это произошло ?

Некоторые считают, что проблема заключается в методе объединения оценок судей, но на самом деле проблема кроется в системе ранжирования на основе очков — любая система, позволяющая Кван стать третьей, привела бы к такому же результату. С тех пор система оценок в фигурном катании неоднократно менялась, и подобные случаи больше не встречаются.

_______________________________________________________________________

Прочитать много интересного - ТГ-канал «Математика не для всех»

Показать полностью 2
300

Германская танковая проблема: торжество статистики и один из первых примеров военного OSINT'a1

В разведке, где информация является ключевым фактором успеха, важнейшей задачей всегда была оценка потенциала и возможностей противника. Традиционные методы, основанные на сборе информации от шпионов, анализе открытых источников и допросах пленных, зачастую оказывались неэффективными, предоставляя неполные, неточные и противоречивые данные. Во время Второй мировой войны перед Союзниками встала острая необходимость определить реальные масштабы производства военной техники в нацистской Германии.

Решением этой проблемы стал нетрадиционный подход, основанный на применении статистического анализа к, казалось бы, незначительным деталям – маркировке на захваченном немецком оборудовании. Этот метод, известный как "Германская танковая проблема", позволил получить удивительно точные оценки производства немецких танков, превосходящие по точности данные, полученные традиционной разведкой. История германской танковой проблемы демонстрирует, как статистические методы способны превратить, казалось бы, хаотичную информацию в ценные разведывательные данные, играя решающую роль в стратегическом планировании и ведении боевых действий. Однако, статистическим анализом производства танков всё не ограничивалось.

Аналитика немецкого производства шин

Первым примером успешного применения этого метода стала оценка производства немецких шин.

Техника анализа маркировки шин как источника информации о германской промышленности развивалась неформально в результате сотрудничества между Экономическим отделом посольства США и британским Министерством экономической войны. Британские эксперты, занимавшиеся изучением немецкой резиновой промышленности, собрали выборку маркировок примерно с 2000 шин противника. Эти шины были сняты с немецких самолётов, сбитых над Британией, а также из складов авиационных и автомобильных шин, захваченных в Северной Африке.

Основной задачей британских специалистов было определение производителей шин, так как название компании всегда указывалось на шине. Однако, помимо названия производителя, каждая шина содержала серийный номер и двухбуквенный код, обозначающий дату производства.

Разгадка кодов дат на шинах

Первым шагом в анализе маркировки шин стало расшифровывание двухбуквенных кодов. Предполагалось, что одна из букв обозначает месяц, а другая – год. При этом логичным было допущение, что код месяца должен иметь 12 вариантов, а код года – от трёх до шести. На основании этой гипотезы удалось выделить буквы, обозначающие месяцы, так как их было больше.

Например, маркировка шин Dunlop представляла собой слово Dunlop Arbeit («работа Dunlop»), написанное в обратном порядке. Компания Fulda использовала буквы из своего названия и города Munster. Phoenix поступала аналогично, используя буквы из слов Phoenix Hamburg. Компания Semperit использовала простую алфавитную последовательность от A до L для месяцев. Для Continental код был сложнее: буквы соответствовали городу Брауншвейг, где находилась штаб-квартира компании, но в перемешанном порядке. Однако позже было установлено, что последовательность все же основывалась на названии города, хотя визуально казалась случайной.

Анализ годов производства

Определение годов оказалось более сложной задачей. Например, новые типы шин (особенно авиационные) могли быть точно датированы, так как их производство начиналось в конкретные периоды. Также 1939 год был легко идентифицируем из-за резкого снижения производства шин, связанного с переходом на выпуск военной продукции.После того как коды годов были расшифрованы для одной компании, их можно было применять к выборке другой компании, анализируя распределение серийных номеров.

На основании анализа удалось установить, что пять крупнейших производителей выпускали более 70% всех шин в Германии. Выборка из 1400 шин позволила получить помесячные данные о производстве с 1939 года до середины 1943 года. Еще 10% производства приходились на двух производителей, данные о которых удалось собрать только за отдельные месяцы 1941–1942 годов.

Остальные 20% производства были оценены на основе относительной важности компаний в выборке. Например, крупные производители были представлены в выборке пропорционально объёму их производства. К июлю 1944 года количество изученных шин достигло 11 000, что обеспечило охват 98% всей индустрии.

Анализ форм для производства шин

Помимо серийных номеров, анализу подверглись так называемые номера форм, которые позволили оценить производственные мощности каждой компании. Формы для изготовления шин нумеровались в простой последовательности, начиная с 1, и каждая форма была предназначена для определенного размера шины. Используя данные британских производителей о средней производительности одной формы, удалось оценить суточную производительность немецких заводов.

Анализ шин дал представление о потреблении резины в Германии. Маркировка шин показывала процент натурального каучука, что позволяло оценить использование запасов сырья.Также данные о производстве авиационных шин использовались для проверки расчетов выпуска немецких самолётов.

Этот анализ впервые предоставил точные данные о производстве шин в Германии по отдельным производителям. Эти сведения позволили более точно оценить значимость шинной промышленности как цели для бомбардировок.Например, при анализе серийных номеров можно было проследить, как производство падало после бомбардировки завода, а затем постепенно восстанавливалось, что позволило оценить эффективность атак.

Таким образом, несмотря на то что начальная выборка составляла всего 0,3% от общего числа шин, результаты оказались удивительно точными благодаря пропорциональному распределению данных по производителям.

Оценка немецкого производства танков

Анализ маркировки шин дал значительные результаты, что показало возможность применения этой техники и к другим типам военного оборудования противника. Американские аналитики поэтому обратили внимание на маркировки немецких танков.

Данные о танковой маркировке были получены из множества источников. В Северной Африке были захвачены немецкие танковые журналы, в которых содержались серийные номера шасси и двигателей танков, даты их производства и названия или коды сборочных заводов. В штабах немецких дивизий иногда находились списки танков в составе определенных подразделений, где были указаны типы танков и серийные номера их шасси.

Документы немецких ремонтных депо включали отчеты с серийными номерами шасси и двигателей всех отремонтированных танков. Также в заказных книгах запчастей и других технических публикациях Вермахта приводились диапазоны серийных номеров танков, чтобы указать, какие модели запчастей нужны для разных танков.

Кроме того, технические разведывательные группы, исследовавшие захваченную технику в Северной Африке, записывали маркировку танков. Некоторые немецкие танки были доступны для более детального изучения как в Англии, так и в США. В результате из всех этих источников было получено около 1200 серийных номеров шасси танков, а также более подробные данные для небольшой части техники.

Диапазоны серийных номеров танков

В отличие от шин, танки не нумеровались отдельными сериями для каждого производителя. Вместо этого для каждого типа танков использовались свои серии номеров, независимо от их изготовителя. Например, все танки Mark I попадали в диапазон номеров от 0 до 20 000, танки Mark II — в диапазон от 20 000 до 30 000 и так далее.

Когда случаи из определенной серии были упорядочены, стало очевидно, что центральный орган распределял отдельным производителям один или несколько диапазонов номеров внутри серии. Однако дальнейший анализ показал, что эти диапазоны не всегда полностью использовались.

При разделении диапазонов на группы по 100 номеров было обнаружено, что различные модели одного и того же типа танков никогда не встречались в пределах одной такой группы. С точки зрения управления запасными частями это было логично, поскольку модели танков могли упоминаться в каталогах запчастей по диапазону номеров шасси, округленных до целых сотен.

Тем не менее это означало наличие промежутков между последним номером шасси определенной модели и началом следующего блока из 100 номеров. Поскольку немцы постоянно вносили изменения в конструкции и модели, это обстоятельство было значительным для оценки производства.

Единственным очевидным решением проблемы стало исследование распределения случаев внутри каждого блока из 100 номеров. Если неиспользование номеров в верхних частях блоков из 100 номеров было значительным, то выборка серийных номеров должна показывать концентрацию случаев в нижних частях блоков, а не равномерное распределение. Таблица, приведенная в анализе, подтвердила, что это действительно так.

Британские данные служили эталоном для анализа аналогичных числовых закономерностей в немецком производств

На основе таблицы было относительно просто вычислить степень использования блоков из 100 номеров для каждой модели танков и, таким образом, оценить реальное производство. Выборка данных оказалась достаточно репрезентативной, так как нижний квартиль иногда равнялся верхнему, но никогда не превышал его значительно. Независимую проверку точности расчетов обеспечивали оценки производства танковых двигателей на основе серийных номеров двигателей.

Коды производителей танков

Идентификация отдельных производителей осложнялась тем, что после 1940 года, из соображений секретности, вместо названий или торговых марок сборщиков на танках начали использовать произвольные трехбуквенные коды. К счастью, на танках, выпущенных ранее, имена сборщиков указывались открыто, что позволило расшифровать коды.

Обнаружилось, что каждый производитель использовал уникальные шильдики. Одни компании применяли медные таблички, другие — пластиковые, стальные или цинковые. Стиль печати на табличках также был индивидуален. Многие сборщики, несмотря на внедрение кодов, не меняли этих характерных особенностей. Например, компания Krupp из Магдебурга просто спилила имя и логотип со старой таблички и выгравировала новый код "bqo".

Некоторые производители, сменив стиль табличек, оставались узнаваемыми благодаря ранее идентифицированным диапазонам серийных номеров. Кроме того, идентификация осуществлялась через систему приемки танков. Каждый танк проверялся инспектором Вермахта, который ставил индивидуальный номер на танк. Эти номера инспекторов не менялись даже при переходе к кодам, что позволило установить производителя.

Наконец, в некоторых случаях коды прямо указывались в танковых журналах, захваченных союзниками. Даже если документ был отделен от танка, серийный номер указывал диапазон, использовавшийся данным производителем.

Результаты анализа маркировки танков

Первый отчет по танкам содержал меньше подробностей, чем отчет по шинам, но был не менее всеобъемлющим. Были получены данные о ежегодном производстве танков по типам за 1939–1942 годы. Определено количество и относительная значимость различных производителей. Анализ маркировки двигателей показал, что за 100% производства танковых двигателей в Германии отвечали два производителя.

Значимость исследования танков, как и в случае с шинами, заключалась в том, что его результаты значительно отличались от принятых разведывательных данных. Например, по тогдашним оценкам, общее производство немецких танков составляло около 40 000 единиц. Однако анализ серийных номеров показал, что это было грубым завышением — реальное число не превышало 14 000 танков.

Оценка уровня производства за 1942 год - 18 000 танков, была снижена до 3 400. Таким образом, анализ серийных номеров развеял миф о немецкой непобедимости, созданный пропагандой и успешной тактикой блицкрига в Польше и Франции. Он внес реализм в оценку реальной силы немецкой военной машины.

Использование других маркировок

После первого отчета был проведен детальный анализ захваченных танков, который выявил дополнительные маркировки, полезные для оценки производства. Например, маркировки коробок передач показали, что для каждого типа танка использовалась одна или две непрерывные серии номеров. Это отличалось от серийных номеров шасси, где диапазоны номеров были разрывными.

Меньший объем данных оказался достаточным для точной оценки производства коробок передач, так как не требовалось анализировать разрывы в сериях. Эти данные позволили уточнить оценки производства танков, учитывая замену коробок передач.

Кроме того, маркировки других компонентов, таких как пушки, радиаторы, моторы башен и катки, позволили повысить точность расчетов и уменьшить размер необходимой выборки.

Маркировки шасси указывали только год сборки, а иногда и вовсе не содержали данных о дате на поздних стадиях войны, что усложняло расчет темпов производства. В то же время маркировки компонентов содержали даты месяца и года, что позволило точнее оценить даты сборки танков.

Пример: если танк был захвачен в декабре 1944 года, а маркировки компонентов имели даты с июня по октябрь 1944 года, сборка, скорее всего, произошла в ноябре 1944 года (при условии отсутствия замен).

Этот метод позволил оценить производственную цепочку танковой индустрии, включая время между выпуском компонентов, сборкой танка и его появлением на фронте. Эти данные оказались ключевыми для анализа уязвимости индустрии при бомбардировках.

Анализ маркировок опорных катков

Возможности глубокого анализа маркировок на небольшом числе танков лучше всего иллюстрируются на примере танка Пантера (Panzerkampfwagen V Panther). Накануне высадки в Нормандии разведка союзников была крайне обеспокоена слухами о масштабном производстве Panther. На тот момент англо-американские войска захватили лишь один такой танк в Сицилии, который был отправлен в Англию. Второй танк, изъятый советскими войсками, также был передан британцам.

Пантера на разгрузке

Тщательный анализ маркировок на этих танках позволил определить предполагаемые даты их сборки: март 1943 года для танка из СССР и февраль 1944 года для танка, захваченного в Сицилии.

Исследование шин опорных катков

Пантера имела восемь осей, на каждой из которых размещались по шесть опорных катков (три с каждой стороны), поддерживавших гусеницы. Таким образом, у танка было по 24 опорных катка с каждой стороны, или 48 шин.

Ранее изучение шин показало, что у производителей шин существовали системы нумерации пресс-форм. На танке, присланном из СССР, все шины были изготовлены на одном заводе, где использовались только девять пресс-форм. Это было очевидно, так как номера пресс-форм варьировались от 1 до 9, причём каждый номер встречался от 3 до 8 раз.

На танке из Сицилии шины производились тремя разными компаниями. У одного из производителей максимальный номер пресс-формы составлял 77, а средний разрыв в номерах серии — три, что позволило предположить, что на этом заводе было около 80 пресс-форм. Аналогичные оценки были выполнены для остальных двух компаний.

Оценка производства танков

На основе числа пресс-форм для шин опорных катков производство танков Пантера было оценено двумя методами:

  1. Оценка производительности пресс-форм. Потенциальное производство шин опорных катков для танков было рассчитано с учётом числа пресс-форм, основываясь на консультациях с британскими производителями. Часть шин предназначалась для замены, а оставшаяся часть использовалась для сборки новых танков.

  2. Сравнение с другими моделями танков. Были определены числа пресс-форм, используемых для шин опорных катков танков предыдущих поколений. Затем была рассчитана зависимость между числом пресс-форм и серийным производством этих моделей, что позволило экстраполировать данные.

Обе методики дали схожие результаты. Они показали, что к февралю 1944 года сборка танков Mark V достигла 270 единиц в месяц при условии полной загрузки мощностей по производству шин. Позже было установлено, что фактическое производство в этот период составило 276 танков.

Кроме того, с успехом анализировались серийные номера автотранспорта, артиллерийских орудий, бомб, ракет и боеприпасов.

Эффективность прогнозов по серийным номерам

Ниже приведен график, показывающий обобщенные результаты оценки различных элементов военно-промышленного комплекса Германии:

Оценки для моторных транспортных средств и ракет обычно точны, для шин и танков часто наблюдается переоценка, а для орудий и самоходных орудий — недооценка. Более 90% оценок находились в допустимых для дальнейшего использования пределах

1. Шины

Исследование, опубликованное в июле 1944 года, охватывало ежемесячное производство грузовых, легковых и авиационных шин в Германии вплоть до первого квартала 1943 года. В следующей таблице сравнивается точность этих оценок за первый квартал с официальной статистикой по средней ежемесячной выработке за весь 1943 год.

Точность оценок, основанных на серийных номерах, особенно поразительна, если учитывать, что разведывательные службы союзников, используя другие методы, оценивали производство в диапазоне от 900,000 до 1,200,000 шин в месяц. Очевидно, что столь значительное расхождение в оценках имело важное значение для выбора целей бомбардировок и определения общих потребностей Германии в резине.

2. Грузовики

Полные данные о производстве всех типов грузовиков в Германии были недоступны для сравнения с оценками на основе серийных номеров. Однако были получены данные Министерства Шпера (неофициальное название Министерства вооружения и военной промышленности Германии, которым руководил Альберт Шпер во время Второй мировой войны) о производстве за 1942 год, которые приведены в сравнении с оценочными данными за тот же год в следующей таблице:

Из приведенной таблицы видно, что грузовики стали исключением из общего правила, согласно которому анализ серийных номеров, как правило, занижал объемы производства в Германии. Предыдущие оценки разведывательных служб предполагали объем производства грузовиков около 200,000 транспортных средств в год.

3. Танки

Оценки производства танков на основе серийных номеров оказались значительно точнее по сравнению с другими оценками производства танков, сделанными разведывательными службами союзников. В таблице ниже сравниваются оценки средней ежемесячной выработки за 1940–1942 годы, основанные на серийных номерах, с данными из документа "Munitions Record No. 24" от 10 августа 1942 года и с соответствующими данными Министерства Шпера. Цифры из "Munitions Record No. 24" отражали согласованное мнение американских и британских разведывательных агентств на тот момент.

Некоторое представление о точности оценки важности отдельных производителей можно увидеть в следующем сравнении оценочной и фактической доли производства танков Mark V (Panther) в 1944 году:

Исключением из точности оценок стали штурмовые орудия (Sturmgeschütz), установленные на танковом шасси. Ошибки оценок производства составили:

  • 1940–1941: занижение на 18%.

  • 1942: занижение на 71%.

  • 1943: занижение на 62%.

Эти значительные ошибки объясняются тем, что сбор данных о серийных номерах штурмовых орудий в полевых условиях был практически не организован. Для многих типов штурмовых орудий серийные номера вообще не фиксировались. Эта проблема так и не была решена, поскольку основное внимание уделялось сбору данных о танках.

4. Орудия

Как уже отмечалось, оценки производства касались лишь нескольких типов немецких орудий, и полные официальные данные для проверки всех оценок отсутствовали. Однако оценки по трём типам 7,5-см орудий были сопоставлены с данными Министерства Шпера.

Эти данные показали, что метод анализа серийных номеров был применим и к оценке производства орудий.

5. Бомбы Фау-1

Статистика Министерства Шпера по производству летающих бомб (V-1) оказалась существенно несогласованной даже с частичными отчётами отдельных сборочных заводов. В результате точных агрегированных данных о производстве V-1 не существует.

  • Документы и интервью показали, что к моменту первой атаки на Англию было произведено около 12,000 бомб.

  • Оценка по серийным номерам указывала на 13,000 бомб, что является довольно точным для этого периода.

  • Планировалось достичь пикового уровня производства в 6000 бомб в месяц, но фактический темп не превышал 3000 из-за нехватки листового металла для финальной сборки.

Фактическое производство в июне и июле 1944 года составляло около 6000 бомб, тогда как оценка по серийным номерам показывала 18,000 бомб. Ошибка объясняется тем, что между производством комплектующих и финальной сборкой не было корреляции. Первоначальная программа производства компонентов была в полном разгаре до появления дефицита металла, и корректировки не успели сработать из-за короткого периода активного производства.

6. Ракеты Фау-2

Оценки производства ракет V-2 оказались более точными. Сравнение оценок и фактического производства представлено ниже:

Первая оценка недооценила общее производство на 1230 единиц из-за использования большого количества ранних экспериментальных ракет на испытаниях. Эти экспериментальные модели нумеровались отдельно от ракет, применявшихся для атак на Англию и Бельгию. Однако последующие оценки оказались намного точнее, с максимальной ошибкой в 17%, и дважды они полностью совпадали с фактическими данными.

Таким образом, анализ серийных номеров оказался ценным инструментом экономической разведки во время Второй мировой войны, предоставив союзникам значительно более точные оценки производства немецкой военной техники, чем традиционные методы разведки.

Список использованных источников

Общие источники:

  • Гудман, Лео А. (1954). «Некоторые практические методы анализа серийных номеров». Журнал Американской статистической ассоциации. 49 (265): 97-112.

  • Ругглз, Р.; Броди, Г. (1947). «Эмпирический подход к экономической разведке во Второй мировой войне». Журнал Американской статистической ассоциации. 42 (237): 72

Математическое описание германской танковой проблемы

Скачать статьи и прочитать много интересного - ТГ-канал «Математика не для всех»

Показать полностью 10
8

Он был в мистическом бреду: был ли этот математик-отшельник гением, чьи идеи могли преобразовать ИИ, или сумасшедшим?

В сентябре 2014 года в одном из селений на склонах Пиренеев садовник Жан-Клод, которому было под 60, был удивлен появлением соседа у своих ворот. Они не разговаривали почти 15 лет после спора о плетистой розе, которую Жан-Клод хотел подрезать. Старик, которому было 86 лет, жил в полном уединении, ухаживая за садом в своей неизменной джеллабе и проводя ночи за письмом, ни на кого не обращая внимания. Но на этот раз старик, с длинной бородой и видом ищущего истину, казался обеспокоенным.

«Ты можешь сделать мне одолжение?» – спросил он Жан-Клода.

«Если смогу».

«Можешь купить мне револьвер?»

Жан-Клод отказался. После этого он заметил, как отшельник, почти глухой и практически слепой, неуверенно передвигался по саду, и позвонил его детям. Даже они не разговаривали с отцом почти 25 лет. Когда они приехали в деревню Лассёр, отшельник снова попросил револьвер, чтобы покончить с собой. Его дом был в ужасном состоянии, коридоры были заставлены полками с колбами с затхлыми жидкостями, повсюду из горшков вылезали заросшие растения, а тысячи страниц загадочных записей лежали в коробках. Но его недуги лишили его возможности заниматься исследованиями, и он больше не видел смысла в жизни. 13 ноября он умер, изможденный и одинокий, в больнице соседнего города Сен-Лизье.

Александр Гротендик: гений и отшельник

Имя этого человека было Александр Гротендик. Родившийся в 1928 году, он прибыл во Францию в 1939 году как беженец из Германии и вскоре произвел революцию в послевоенной математике, подобно тому, как Эйнштейн изменил физику поколением ранее. Гротендик вышел за рамки отдельных дисциплин, таких как геометрия, алгебра и топология, и стремился найти универсальный язык, объединяющий их все. В основе его работы лежала новая концепция пространства, которая освобождала его от евклидовой тирании фиксированных точек и вводила в мир относительности и вероятности. Поток концепций и инструментов, которые он представил в 1950-х и 60-х годах, вызывал восхищение у коллег.

Александр Гротендик преподавал в элитном Институте высоких научных исследований в 1960-х годах

Александр Гротендик преподавал в элитном Институте высоких научных исследований в 1960-х годах

Однако в 1970 году произошел поворотный момент: Гротендик ушел из Французского института высших научных исследований (IHES) в знак протеста против финансирования, которое институт получал от Министерства обороны, и завершил свою карьеру в высшей математике. До 1991 года он занимал несколько незначительных преподавательских должностей, после чего покинул свой дом у подножия горы Ванту и исчез. Никто – ни друзья, ни семья, ни коллеги, ни близкие, которые знали его как "Шурика" (детское прозвище, русское уменьшительное от Александр) – не знали, где он находится.

Одиночество и философские размышления

В Лассёре он жил почти в полном одиночестве, без телевидения, радио, телефона или интернета. Лишь немногие последователи отправлялись в деревню, узнав о его местонахождении; он вежливо отказывался принимать большинство из них. Когда он все же разговаривал, он иногда упоминал своих истинных друзей: растения. Гротендик верил, что древесина обладает сознанием. Он говорил Мишелю Камиллери, местному переплетчику, который помогал собирать его труды, что его кухонный стол "знает о тебе больше, чем ты когда-либо узнаешь о себе". Но эти странные увлечения вели его в темные уголки разума: он говорил одному из посетителей, что в его доме есть существа, которые могут ему навредить.

Гротендик, слева, с коллегой-математиком Лораном Шварцем

Гротендик, слева, с коллегой-математиком Лораном Шварцем

Наследие и интерес к работам Гротендика

Гротендик пытался стереть следы своей известности, но его гениальность оставалась неизгладимой. Он упоминается в одном из последних романов Кормака Маккарти "Stella Maris" как серый кардинал, ведущий своего психически нестабильного героя-математика. Публикация его обширных мемуаров "Сборы и посевы" в 2022 году возродила интерес к его работам. Более того, существует растущий академический и корпоративный интерес к возможному применению его идей в технологических целях. Китайский телекоммуникационный гигант Huawei считает, что его концепция топоса может стать ключом к созданию следующего поколения ИИ, и нанял лауреата медали Филдса Лорана Лаффорга для исследования этой темы. Однако, как отметил его бывший коллега Пьер Картье, мотивы Гротендика были далеки от мирских:

"Даже в математической среде он не был совсем своим," пишет Картье. "Он вел монолог или, скорее, диалог с математикой и Богом, которые для него были единым целым."

Тайны последних лет

Были ли его последние записи, объемом 70 000 страниц, беспорядочными каракулями безумца? Или же отшельник из Лассёра сделал последнюю попытку проникнуть в тайны устройства вселенной? И что бы сказал этот человек, отвергший научное сообщество и современное общество, о том, что его интеллектуальную собственность сейчас пытаются использовать в технологических корпорациях?

В знаменитом отрывке из "Сборов и посевов" Гротендик пишет, что большинство математиков работают в рамках уже существующей концепции:

"Они подобны наследникам большого и красивого дома, готового к заселению, со всеми его гостинами, кухнями и мастерскими, со всеми инструментами и утварью, которые необходимы для приготовления пищи и ремесел." Но он относил себя к более редкому типу: строителям, "чьим инстинктивным призванием и радостью является строительство новых домов."

Наследие и раздумья сына

Теперь его сын, Матьё Гротендик, размышляет, что делать с домом отца. Лассёр находится на вершине холма в 35 км от испанской границы, в отдаленном департаменте Арьеж, ставшем убежищем для маргиналов, бродяг и утопистов. В январе 2023 года, в холодное утро, я поднялся в деревню, скрытую туманом, среди лесов дуба и бука, под взглядом красных коршунов, парящих над полями. Дом Гротендика – единственный двухэтажный дом в Лассёре – расположен на южной окраине деревни.

Матье Гротендик возле дома своего отца в Лассере во французских Пиренеях

Матье Гротендик возле дома своего отца в Лассере во французских Пиренеях

Матьё, одетый в халат, открывает дверь с видом человека, только что проснувшегося из зимней спячки. Ему 57 лет, его лицо иссечено морщинами, нос напоминает киль корабля. Наследство дома, в котором его отец пережил такие душевные испытания, тяготит его.

"Это место имеет историю, которая больше меня," – говорит он, с голосом, смягченным курением. "И поскольку у меня нет средств привести его в порядок, я чувствую себя плохо. Я чувствую, что до сих пор живу в доме отца."

Бывший керамист, Матьё теперь работает музыкантом на полставки. На кухне стоит длинный свиток с китайской каллиграфией, рядом с фотографиями статуи Будды и портретами его матери, Мирей Дюфор, которую Гротендик оставил в 1970 году. (Матьё – ее младший сын; у него есть сестра Жанна и брат Александр. У Гротендика также было двое других сыновей, Серж и Джон, от двух других женщин.) Над кроватью Матьё висит яркий портрет его деда по отцовской линии, Александра Шапиро, украинского еврейского анархиста, который потерял руку, спасаясь из царской тюрьмы, и позже сражался в гражданской войне в Испании.

Наследие боли и гениальности

Даже обладая огромной мудростью и глубоким пониманием, в моем отце всегда ощущалась чрезмерность. Он всегда стремился поставить себя в опасное положение. Шапиро и его спутница, немецкая писательница Йоханна Гротендик, оставили пятилетнего Александра в приемной семье в Гамбурге, когда в 1933 году бежали из нацистской Германии, чтобы бороться за социалистические идеалы в Европе. В 1939 году он воссоединился с матерью и оставшуюся часть войны провел либо в интернационном лагере во Франции, либо скрываясь. Его еврейского отца, задержанного отдельно, отправили в Освенцим, где он был убит по прибытии в 1942 году. Именно это наследие из брошенности, бедности и насилия, по мнению Матьё, сделало Гротендика гением, но в итоге и разрушило его. "Художники и гении компенсируют свои недостатки и травмы. Рана, сделавшая Шурика гением, догнала его в конце жизни," — считает Матьё.

Матьё проводит меня в огромный, обветшалый амбар за домом. На полу, покрытом землей, лежит куча стеклянных колб, заключенных в плетеные корзины: в них находятся остатки растительных настоек математика, для которых требовались тысячи литров спирта. Далекие от традиционной математики, последние исследования Гротендика были сосредоточены на вопросе, почему существует зло в мире. Его последняя записанная работа представляла собой тетрадь с именами депортированных в одном из конвоев, в котором находился его отец, в августе 1942 года. Матьё считает, что настойки его отца были связаны с попыткой объяснить природу зла: это была своего рода алхимия, через которую он пытался выявить свойства различных видов, устойчивость к невзгодам и агрессии.

"Это трудно понять," — признается Матьё. "Все, что я знаю, это то, что эти настойки не предназначались для питья."

После разговора Матьё согласился показать мне рукописи отца, хранящиеся в Лассере, которые его дочь отсканировала на жесткий диск. В начале 2023 года семья все еще вела переговоры о передаче этих документов во Французскую национальную библиотеку. Сейчас они уже приняты и со временем станут доступны для исследователей. Однако требуется серьезная научная работа, чтобы оценить их значимость в математике, философии и литературе. Я явно не могу судить о первой из этих областей.

Открыв первую попавшуюся страницу, я увидел разборчивый, но нервный почерк, иногда встречались разноцветные топологические диаграммы, упоминания имен прошлых мыслителей, часто физиков — Максвелла, Планка, Эйнштейна — и частые ссылки на Сатану и «этот проклятый мир». Его дети тоже пытаются разобраться в этом грандиозном наследии.

«Это мистично, но в то же время приземленно. Он говорит о жизни с определенным морализмом. Это совершенно не в духе времени,» — говорит Матьё. «Но, по моему мнению, там есть жемчужины. Он был королем формулировки идей.»

После пары часов чтения у меня кружилась голова, и я ощутил, как бездна смотрит на меня. Можно только представить, каково было самому Гротендику. По словам Матьё, однажды друг спросил его отца, о чем тот больше всего мечтает. Математик ответил: «Чтобы этот адский круг мыслей наконец прекратился».

Пути в мистицизм

Южный склон горы Ванту во Франции был покрыт облачными тенями в апреле, когда велосипедисты огибали вершину. В департаменте Воклюз в Провансе, именно здесь Александр Гротендик начал свои первые шаги в мистицизме. Сейчас в этом районе живет другой его сын, Александр. Я иду по ухабистой дороге, чтобы встретиться с 62-летним мужчиной, который выходит мне навстречу из дубового леса с улыбкой. В потертом свитере, темных брюках и тапочках, Александр выглядит стройнее своего брата, с ветром обветренными щеками.

Он ведет меня в огромный ангар, где живет. Здесь свалены усилители и музыкальные инструменты; в глубине расположен цех, где он делает калимбы — африканские клавишные музыкальные инструменты. В 1980 году его отец переехал на несколько километров западнее, в дом за пределами деревни Мормуарон. В последующие годы мысли Гротендика все больше уходили в мистические дали. «Даже со всей своей мудростью и глубиной понимания, в моем отце всегда ощущалась чрезмерность,» — говорит Александр.

Гротендик покинул коммуну, частью которой он был с 1973 года, в деревне к северу от Монпелье, где он продолжал преподавать в университете. С 1970 года он стал одним из первых радикальных экологов во Франции и все больше увлекался медитацией. В 1979 году он провел год, сосредоточенно изучая письма своих родителей, что окончательно развеяло все романтические иллюзии о них.

«Миф об их великой любви рухнул для Шурика — это была чистая иллюзия,» — говорит Жанна Гротендик, внучка писательницы Йоханны. «Он смог расшифровать все травматические элементы своего детства. Он понял, что был просто брошен собственной матерью.»

Александр Гротендик в детстве...

Александр Гротендик в детстве...

... и в его доме в Лассаре в 2013 году

... и в его доме в Лассаре в 2013 году

Эта озабоченность прошлым усилилась в середине 1980-х годов, когда Гротендик работал над рукописью «Урожаи и посевы». Это размышление о его математической карьере, наполненное потрясающими афористическими инсайтами, как, например, метафора о доме. Но это произведение, переполненное сносками в духе Дэвида Фостера Уоллеса, было безжалостным и подавляющим, пронизанным чувством предательства его бывшими коллегами. После его откровений о родителях это чувство стало своего рода руководящим принципом.

«Это было систематическое у папы — возвести кого-то на пьедестал, чтобы увидеть их недостатки. А затем — бац! — они сгорали в огне,» — говорит Александр.

В этот период Александр Гротендик, хотя и продолжал заниматься математикой, всё больше увлекался мистицизмом. Он начал рассматривать свои сны не как простые продукты собственного разума, а как божественные послания от существа, которого он называл "Сновидцем". Это существо было для него синонимом Бога, своего рода космической матерью.

"Как материнская грудь, 'великое сновидение' предлагает нам густое и насыщенное молоко, хорошее для того, чтобы питать и укреплять душу," — писал он позже в трактате на эту тему под названием "Ключ Снов".

Пьер Делинь, его блестящий ученик, которого Гротендик обвинил в предательстве в своих мемуарах "Сборы и Сеяния", считал, что его старый учитель утратил былую ясность мысли. "Это был уже не тот Гротендик, которым я восхищался," — сказал он по телефону из Института перспективных исследований в Принстоне.

Полная изоляция

К этому времени Гротендик оказался в полной изоляции. Он порвал связи с природой и со всеми окружающими. К лету 1989 года его пророческие сны усилились и превратились в ежедневные "аудиенции" с ангелом, которого он называл то Флорой, то Люциферой, в зависимости от того, являлась ли она доброжелательной или мучительной. Этот ангел наставлял его в новой космологии, центральным вопросом которой были страдания и зло в божьем замысле. Гротендик, например, полагал, что скорость света, близкая, но не точно равная 300 000 км/с, является доказательством вмешательства Сатаны.

"Он находился в состоянии мистического бреда," — говорит Жан Малгуар, другой бывший ученик, ныне профессор Монпелье. "Это также форма психического заболевания. Было бы хорошо, если бы его в то время осмотрел психиатр."

В реальной жизни Гротендик становился всё более отстранённым и пугающим. Его сын Матье провёл два месяца в Мормуароне, работая над домом отца, но за всё это время Гротендик пригласил его внутрь только один раз. Матье не выдержал и сорвался: "Он потерял интерес к другим людям. Я больше не ощущал в нём никакого подлинного или искреннего сочувствия." Но, несмотря на это, Гротендик всё же продолжал интересоваться душами людей. 26 января 1990 года он разослал 250 своим знакомым, включая детей, мессианское семистраничное письмо под названием "Письмо о Благой Вести". В нём он объявлял дату — 14 октября 1996 года — как "День Освобождения", когда зло на Земле прекратит своё существование, и говорил, что они были избраны для того, чтобы помочь наступлению этой новой эры.

В июне 1990 года, как бы укрепляя свою духовную приверженность, Гротендик постился 45 дней (он хотел превзойти 40-дневный пост Христа), охлаждая себя в жару лета в винной бочке, наполненной водой. Видя, как его отец худеет до измождённого состояния, напоминающего узников нацистских концлагерей, Александр-младший осознал, что, возможно, его отец подражал кому-то другому:

"В каком-то смысле, он воссоединялся со своим отцом."

Гротендик едва не умер. Он прекратил пост только после того, как его уговорил снова начать есть партнер Иоганны. Она считает, что этот пост нанёс необратимый вред мозгу её отца на клеточном уровне, что привело к дальнейшей утрате его способности к рациональному мышлению. Вскоре после этого Гротендик вызвал Малгуара в Мормуарон, чтобы передать ему 28 000 страниц математических рукописей (которые теперь доступны онлайн). Он показал своему ученику металлическую бочку, полную пепла: остатки большого количества личных бумаг, включая письма родителей, которые он сжёг. Прошлое утратило для него значение, и теперь Гротендик мог только смотреть вперёд. Спустя год, без предупреждения, он покинул свой дом, выбрав путь, известный только ему.

Последние дни

Круглая плита из чёрного песчаника, сделанная Иоганной и теперь укрытая дикими розами, отмечает место захоронения Гротендика на кладбище Лассера. Она почти скрыта за телеграфным столбом. Математик был одинок в момент своей смерти в больнице; после нескольких недель, проведённых с детьми, он снова отверг их, принимая помощь только от посредников.

Присутствие семьи, казалось, вызывало у него невыносимые чувства. В своих письмах он оценивал людей своей жизни по тому, насколько сильно они находились под влиянием Сатаны. Но, как указывает Александр, это было также отражением его собственного беспокойного подсознания:

"Ему не нравилось то, что он видел в зеркале, которое мы ему показывали."

К концу своей жизни Александр Гротендик, с длинной седой бородой и в очках, жил в уединении в Лассере, Франция. На одной из последних фотографий, сделанных его сыном Матьё, Гротендик лежит в постели, вязаная шапка на голове, а на стене за ним висит портрет его отца. Эта фотография запечатлела человека, который в последние годы жизни всё больше уходил в себя и разрывал связи с окружающим миром.

В конце 90-х годов случайно выяснилось, что Гротендик живет в Лассере, когда его сын Александр подписал контракт на автострахование и обнаружил, что у страховой компании уже есть адрес на имя его отца. Он попытался связаться с Гротендиком и однажды увидел его на рынке в городе Сен-Жирон, на юге от Лассера. "Он увидел меня и широко улыбнулся, был очень счастлив," — рассказывает Александр. Однако через минуту Гротендик изменился, его улыбка исчезла, и он явно решил, что не должен иметь никакого отношения к сыну. Этот момент стал для Александра "ледяным душем". Он не видел своего отца снова до его смерти в 2014 году.

До начала 2000-х годов Гротендик продолжал работать в интенсивном темпе, часто проводя ночи за кухонным столом, записывая свои "медитации". Однако к середине 2000-х его писательская активность начала угасать. По словам его сына Матьё, в своих поздних записях Гротендик скрупулёзно фиксировал каждое свое действие, как если бы мельчайшие подробности его жизни имели глубокое значение. Эти тексты были настолько болезненными для Матьё, что он решил не передавать их в Национальную библиотеку.

В последние годы жизни Гротендик страдал от "неуправляемой антипатии" к своей работе, которую он приписывал зловредным силам, но которая могла быть связана с депрессией. В 1997 году он писал: "Самое ужасное в судьбе жертв — это то, что Сатана властвует над их мыслями и чувствами." Он даже рассматривал возможность самоубийства, но в конце концов решил продолжать жить как самопровозглашённая жертва.

Гротендик также пытался избавиться от своего дома в Лассере, предложив его бесплатно своему переплётчику, Мишелю Камиллери, при условии, что тот будет заботиться о его растениях. Когда Камиллери отказался, Гротендик был возмущён, увидев в этом снова "руку Сатаны". В 2001 году дом едва не сгорел, когда дымоход неочищенной печи загорелся. Некоторые свидетели утверждают, что Гротендик пытался помешать пожарным попасть на его территорию, хотя Матьё в это не верит.

Дом Гротендика в Лассере

Дом Гротендика в Лассере

По мере того, как его состояние ухудшалось, Гротендик всё больше замыкался в себе. Попытки вовлечь его в местное сообщество заканчивались отповедями, полными библейских цитат и обвинениями. К середине 2000-х годов Гротендик был полностью потерян в лабиринтах своего сознания.

Наследие Гротендика

В середине апреля, элегантные парижане выходят из отполированного фойе обновленного отеля в седьмом округе, направляясь на обед. Когда-то в этом здании транслировались первые французские телепрограммы; теперь же компания Huawei стремится сделать здесь похожий шаг в области искусственного интеллекта. Она создала на этом месте Центр-Лагранж, передовой институт по исследованию математики, и наняла ведущих французских математиков, включая Лорана Лаффорга, для работы там. Их деятельность окружена аурой секретности, что вызывает подозрения на Западе по поводу китайских технологий. Сначала Huawei отказалась отвечать на любые вопросы, позже согласилась на несколько ответов по электронной почте.

Особый интерес для Huawei представляет концепция топосов, разработанная Александром Гротендиком в 1960-х годах. Среди всех его концепций, топосы были самой дальней ступенью в его стремлении выявить более глубокие алгебраические ценности в сердце математического пространства и, таким образом, создать геометрию без фиксированных точек. Гротендик описывал топосы как "обширную и спокойную реку", из которой можно извлекать фундаментальные математические истины. Оливия Карамелло рассматривает их скорее как "мосты", способные облегчить передачу информации между различными областями. Лаффорг подтверждает, что Huawei исследует применение топосов в ряде областей, включая телекоммуникации и искусственный интеллект.

Матье в доме своего отца

Матье в доме своего отца

Карамелло описывает топосы как математическое воплощение идеи видения; интеграцию всех возможных точек зрения на данную математическую ситуацию, которая раскрывает её наиболее существенные черты. Применение топосов в ИИ могло бы позволить компьютерам выходить за рамки данных, связанных, например, с яблоком; геометрических координат его изображения или метаданных. Тогда ИИ мог бы начать распознавать объекты так, как это делаем мы — через более глубокое "семантическое" понимание того, что такое яблоко. Однако, по словам Лаффорга, практическое применение для создания следующего поколения "думающего" ИИ находится еще далеко.

Встает более широкий вопрос о том, хотел бы ли этого сам Гротендик. В 1972 году, во время своего экологического периода, он выразил обеспокоенность тем, что капиталистическое общество ведет человечество к гибели, и выступил с лекцией в ЦЕРН под названием "Можем ли мы продолжать научные исследования?". Он не знал об ИИ, но уже тогда был против слияния науки и корпоративной индустрии. Учитывая его пацифистские ценности, он, вероятно, также был бы против того, чтобы Huawei использовала его работу; генеральный директор Huawei, Жэнь Чжэнфэй, является бывшим членом инженерного корпуса Народно-освободительной армии Китая. Министерство обороны США и некоторые независимые исследователи полагают, что Huawei контролируется китайскими военными.

Huawei настаивает на том, что является частной компанией, принадлежащей ее сотрудникам и основателю Жэню Чжэнфэю, и что она "не принадлежит, не контролируется и не связана с каким-либо правительством или третьей компанией".

Лаффорг отмечает, что французский IHES, где работал Гротендик и позже он сам, финансировался промышленными компаниями — и считает интерес Huawei законным. Карамелло, основатель и президент исследовательской организации Институт Гротендика, считает, что он хотел бы систематического изучения его концепций для их реализации.

"Теория топосов сама по себе является своего рода машиной, которая может расширить наше воображение", говорит она. "Так что, видите, Гротендик был не против использования машин. Он был против слепых машин или грубой силы".

Однако настораживает степень непрозрачности в целях Huawei по отношению к ИИ и их сотрудничеству, включая связи с Институтом Гротендика, где Лаффорг входит в научный совет. Но Карамелло подчеркивает, что это полностью независимая организация, занимающаяся теоретическими, а не прикладными исследованиями, и делает свои выводы доступными для всех. Она заявляет, что институт не исследует ИИ, и что участие Лаффорга связано исключительно с его экспертизой в математике Гротендика.

Маттье Гротендик уверен, что его отец не одобрил бы, чтобы Huawei или какая-либо другая корпорация использовала его работы: «Нет. Я даже не спрашиваю. Я знаю». Нет сомнений в том, что математик считал современную науку морально деградировавшей, и документы из Лассера пытались примирить её с метафизикой и моральной философией. В отличие от мистики Гротендика 1980-х годов, здесь присутствует структура и намерение. Они начинаются с чуть менее 5 000 страниц, посвящённых Схемам Элементарной Геометрии и Структуре Психики. По словам математика Жоржа Мальцинотиса, который исследовал этот раздел, эти части содержат математику в «должной и правильной форме». Затем Гротендик приступает к Проблеме Зла, которая растягивается на 14 000 страниц, написанных в течение 1990-х годов.

Судя по примерно 200 страницам, которые я пытаюсь расшифровать, Гротендик вложил титанические усилия в свою новую космологию. Он, похоже, пытался постичь работу зла на уровне материи и энергии. Он спорит с Эйнштейном, Джеймсом Кларком Максвеллом и Дарвином, особенно о роли случая в том, что он рассматривал как божественно созданную вселенную. Есть нумерологические размышления о значении лунных и солнечных циклов, девятимесячного срока беременности. Он переименовывает месяцы в новом календаре: январь становится Рома, август — Сонга.

Некоторые из многочисленных рукописей Гротендика

Некоторые из многочисленных рукописей Гротендика

Насколько это работа значима и насколько пустая мания? По словам Пьера Делига, Гротендик стал фатально потерян в своём уединении. Он говорит, что у него мало интереса к чтению Лассерских писаний, «потому что у него было мало контакта с другими математиками. Он был ограничен собственными идеями, а не использовал идеи других». Но для других ситуация не столь однозначна, включая Каравелло. По её мнению, это сочетание математики и метафизики верно отражает его граничащий ум и может привести к неожиданным инсайтам: она указывает на использование инструментария расслоений Хопфа для объяснения психологических явлений в «Структуре Психики».

«Мы находимся в самом начале огромного исследования этих манускриптов. И, безусловно, в них будут чудеса», — говорит она.

Гротендик продолжал быть одержим злом до самого конца. Возможно, сломленный своими травмами, он не мог позволить себе простить и представить мир в более добром свете. Но его дети, несмотря на долгое отчуждение, не стали такими же. Маттье отвергает идею о том, что его отец повторил на них ту же оставленность, которую сам пережил в детстве: «Мы были взрослыми, так что это ничто по сравнению с тем, что он пережил. Он справился гораздо лучше, чем его родители».

Отвержение своих детей ранило Иоанну, но она понимает, что в её отце было что-то фундаментально сломанное. «В его сознании, я думаю, он не оставил нас. Мы существовали в параллельной реальности для него. Тот факт, что он сжёг письма своих родителей, был чрезвычайно показателен: он не чувствовал себя частью семейной цепи поколений». Примечательно, что троица не осуждает своего отца и открыто обсуждает его испытания.

«Мы принимаем это», — говорит Александр. «Это было испытание, которого он жаждал».

Всё это и много другое — ТГ "Математика не для всех"

Источник: https://www.theguardian.com/science/article/2024/aug/31/alex...

Показать полностью 10
8

Ахиллесова пята ИИ: простая задача, обнажившая слабости всех языковых моделей

Недавнее исследование, проведенное группой экспертов из ведущих институтов, выявило существенные недостатки в логических способностях даже самых продвинутых LLM. Статья «Алиса в Стране чудес» демонстрирует, что при решении элементарных логических задач современные языковые модели демонстрируют неожиданно низкую эффективность.

Крупные языковые модели (LLM), такие как закрытые GPT-3.5/4, Claude, Gemini или открытые LLaMa 2/3, Mistral, Mixtral, а также более новые Dbrx или Command R+, часто описываются как экземпляры фундаментальных моделей — то есть, моделей, которые эффективно переносят знания на различные задачи и условия при обучении на малом количестве примеров или вообще без них, демонстрируя при этом закономерности масштабирования, предсказывающие улучшение функциональности при увеличении масштаба предварительного обучения. Эти утверждения об успешном выполнении различных функций и задач основываются на измерениях, проведенных на различных наборах стандартизированных тестов, показывающих высокие результаты для таких моделей.

Мы демонстрируем здесь резкое снижение функциональных и логических способностей современных моделей, обученных в крупнейших доступных масштабах и заявляющих о сильной функциональности, используя простую, короткую, общепринятую задачу на здравый смысл (проблему AIW), сформулированную в краткой естественной форме, легко решаемую людьми. Снижение драматично, так как модели показывают сильные колебания даже при незначительных вариациях задачи, которые не должны влиять на ее решение, также выражая сильную самоуверенность в неправильных решениях, часто подкрепленную правдоподобно звучащими объяснениями‑конфабуляциями.

Различные стандартные вмешательства в попытке получить правильное решение, такие как различные виды улучшенных подсказок или побуждение моделей пересмотреть неверные решения путем многоэтапной переоценки, терпят неудачу. Мы представляем эти первоначальные наблюдения научному и технологическому сообществу, чтобы стимулировать срочную переоценку заявленных возможностей текущего поколения LLM. Такая переоценка также требует совместных действий по созданию стандартизированных тестов, которые позволили бы должным образом выявлять подобные базовые недостатки в рассуждениях, которым очевидно удается оставаться необнаруженными при современных процедурах оценки и тестирования.

«Задача здравого смысла», названная в статье «проблемой AIW», на самом деле проста: «У Алисы есть N братьев и M сестер. Сколько сестер у брата Алисы?» Значения N и M (всегда натуральные числа) и порядок упоминания братьев и сестер могут различаться. Исследователи использовали различные комбинации чисел и типы подсказок, чтобы получить точное представление о том, как разные модели справляются с систематическими вариациями задачи AIW. Независимо от вариантов, структура задачи остается неизменной, и правильный ответ всегда получается путем прибавления Алисы к ее сестрам (M + 1). Эту логику уже способно понять большинство детей младшего школьного возраста. Языковые модели, напротив, были способны решать проблему AIW лишь эпизодически, если вообще решали. Вот пример ответа языковой модели, столкнувшейся с простейшей версией вопроса:

***»У Алисы четыре брата и одна сестра. Сколько сестер у брата Алисы?» — ***«Классическая головоломка с нестандартным мышлением! Давайте посмотрим поближе: у Алисы есть четыре брата. У Алисы также есть сестра (она сама). Итак, у каждого из братьев Алисы есть... (барабанная дробь)... сестра, и это сама Алиса! Таким образом, ответ: у каждого из братьев Алисы есть одна сестра.»

Это может показаться правдоподобным, но все равно неверно (на самом деле у братьев Алисы две сестры). У других тестируемых языковых ИИ также возникают проблемы — серьезные проблемы, в зависимости от вопроса. Иногда они запутываются в абсурдных рассуждениях, неоднократно приходят к неверным результатам и объявляют их «правильными». Следовательно, проблематичны не только ложные результаты, но и то, что ИИ используют псевдоразумные аргументы в свою поддержку. Даже вмешательства исследователей, побуждающие их критически пересмотреть свои ответы, не помогают. Соответственно, исследователи отмечают: «[...] модели также выражают сильную самоуверенность в своих неправильных решениях, одновременно предоставляя часто бессмысленные объяснения, похожие на „рассуждения“, [...] чтобы оправдать и подкрепить достоверность своих явно неудачных ответов, делая их правдоподобными».

Более чем каждый второй ответ неправильный

В целом, у языковых моделей (LLMs) средняя частота правильных ответов была значительно ниже 50%, при этом более крупные модели, как правило, работали заметно лучше, чем модели меньшего размера (например, GPT-4 показывает частоту правильных ответов чуть выше 60%). Это снова подтверждает преимущества большего масштаба, но даже модели самого большого масштаба работают недостаточно хорошо для систем, претендующих на надежные базовые рассуждения. Ахиллесова пята ИИ: Простая задача, обнажившая слабости языковых моделей»

Особенно показательны сильные колебания результатов даже при незначительных вариациях задачи AIW. Это явный признак того, что модели не способны к надежному базовому рассуждению, что приводит к путанице даже при столкновении с незначительными изменениями проблемы, которые не должны влиять на правильность решения. Более сложная версия вопроса («AIW + проблема») в конечном итоге подтолкнула все модели к пределу их способностей к рассуждению.

По словам исследователей, многие из протестированных моделей достигли высоких результатов в различных стандартизированных тестах, разработанных для проверки разных возможностей, включая рассуждения, но при этом потерпели неудачу в решении очень простой задачи AIW. Таким образом, в своей статье ученые предполагают, что эти контрольные показатели неверно отражают недостатки базовых рассуждений этих моделей, а также ставят под сомнение использование текущих стандартизированных тестов для сравнения моделей.

Языковые модели на испытательном стенде

Хотя статья еще не прошла рецензирование, ее результаты уже вызывают волну интереса. Насколько эффективны LLMs на самом деле? Что это значит для использования LLMs, если они не справляются с заданиями уровня начальной школы? Соавтор Женя Джитсев (JSC) говорит: «Мы перегружены обсуждениями и запросами в результате нашей статьи».

Выводы ученых ставят под сомнение многие устоявшиеся представления и делают абсолютно необходимыми дальнейшие исследования компетентности языковых моделей. Джитсев добавляет: «Наша статья дает чрезвычайно важное новое представление о реальных способностях языковых моделей делать правильные выводы, следуя надлежащим базовым рассуждениям. Здесь необходимы дальнейшие исследования, чтобы понять, как и почему базовые рассуждения в текущих моделях разбиваются о такие простые задачи».

Очень длинная ветка обсуждений статьи с «разжевыванием» основных моментов — на форуме

Показать полностью 2
Отличная работа, все прочитано!