369
Наука и технологии
Серия Нейро

Искусственный интеллект в разы превосходит людей в диагностике заболеваний4

Как и во многих отраслях, в медицине встречаются как хорошие, так и плохие работники. Только если, например, безалаберность сантехника обычно обходится лишь в дополнительные траты, то за неграмотность и лень докторов людям частенько приходится платить здоровьем, а то и жизнью.

Однако, уже в ближайшем будущем ситуация может измениться — врачей может заменить искусственный интеллект. А если ещё точнее — он, в принципе, уже готов их заменить, дело за самими людьми.

Компания Microsoft провело исследование, в рамках которого тестировались возможности современных нейросетей правильно диагностировать различные заболевания. В тестах участвовали разные вариации GPT, Llama, Claude, Gemini, Grok и DeepSeek. Кроме того, поверх выбранных нейросетей работала специальная система Microsoft AI Diagnostic Orchestrator (MAI-DxO), которая имитировала консилиум специалистов.

Тестирование проходило на 304 реальных клинических случаях разной степени сложности: начиная от банального коронавируса и заканчивая тяжёлыми и редкими поражениями разных органов. Так как модели обучались на данных, собранных из интернета, в выборку включили 56 случаев, которые произошли уже после завершения обучения всех моделей.

Со стороны людей участвовали 21 практикующих врача из США и Великобритании с опытом работы по специальности в 5-20 лет. Чтобы уравняться с нейросетями, врачам нельзя было использовать никаких дополнительных источников, только свои собственные знания.

В конце тестирования оценивались как нейросети, так и люди — исследователи смотрели, смогли ли участники эксперимента вывести виртуального пациент на правильный диагноз.

«Беседа» с пациентом проходила в формате свободного тестового чата: и люди и нейросети получали одну и ту же вводную информацию, а потом были вольны задавать дополнительные вопросы, назначать любые исследования и анализы без ограничений.

В итоге оказалось, что нейросети даже общей направленности на голову превзошли врачей. Для людей средний уровень точности в постановке диагноза составил около 20%, а вот среди нейросетей даже простенькая и совершенно устаревшая уже GPT-3.5 Turbo оказалась лучше большинства специалистов:

Искусственный интеллект в разы превосходит людей в диагностике заболеваний

Кроме того, нейросети сильно экономили бюджет. В среднем врачам понадобилось 2963 доллара на диагноз при точности в 20%. При сопоставимых расходах GPT-4o показывала точность в 50%. Ну и чем больше нейросетям выделяли бюджет на анализы и исследования, тем точнее они диагностировали заболевания. У людей такого не наблюдалось — при увеличении бюджета точность диагностики кожаных не повышалась.

Ещё очень хорошо себя показала система MAI-DxO: с нулевым бюджетом, только основываясь на жалобах пациента она смогла поставить диагноз точнее, чем практически все врачи с тратами на анализы и обследования.

В целом доработанная система, работавшая в связке с нейросетями общего назначения показала максимальную точность в 81,9% при ограничениях в бюджете. Если же позволить системе ни в чём себя не ограничивать, то она ставила правильный диагноз в 85,5% случаев.

В общем, в одиночку отдельно взятый врач с немалым опытом работы даже близко не способен приблизиться к точности нейросети. Забороть желязяку даже на данном этапе может только консилиум кожаных, изрядно при этом потратившись на диагностику.

При этом, несмотря на то, что люди с треском проиграли нейросетям, принимавшие участие в эксперименте врачи считают, что искусственный интеллект лишь дополняет докторов и других медицинских специалистов.

P.S. Ещё у меня есть бессмысленные и беспощадные ТГ-каналы (ну а как без них?):

О науке, творчестве и прочей дичи: https://t.me/deeplabscience;

Вот тут про молекулярную биологию, медицину и новые исследования: https://t.me/nextmedi.

Наука и технологии

59 постов20 подписчиков

Правила сообщества

1. Никакого нейросетевого творчества, только авторские посты 2. Политика/религия под запретом

Вы смотрите срез комментариев. Показать все
78
Автор поста оценил этот комментарий

Не совсем честное исследование. ОБразование учит пользоваться источниками, а не хранить все в голове. Врач в обычной жизни пользуется интернетом, и даже нейросетями.
Хотя да, встречались мне коновалы, которых махнул бы не глядя на сети

раскрыть ветку (6)
18
Автор поста оценил этот комментарий

Есть ещё такой момент как эрудиция, которая связана с "насмотренностью". И если врач не знал о каких то редких заболеваниях, то и диагностировать он их не сможет, даже при наличии интернета.

Вся надежда на Китай, они уже внедрили ИИ в судебные решения, значит и в медицину внедрят.

раскрыть ветку (4)
9
Автор поста оценил этот комментарий

Я, кстати, только за, чтобы нейросеть советовала врачу при первичном осмотре. И чтобы эта информация (рекомендации нейросети), записывались в диагнозе. И если врач, дебил, назначит другое лечение - чтобы в случае ошибки ему ата-та по жопе прилетало.

P.S. Сорри за эмоции, навеяло из прошлого. Был гнойный бурсит в колене месяцев 8 назад. Врач в бесплатной травме ни хрена не опознал (хотя колено пухло на глазах, и я нашатырь просил, чтоб сознание от радости не потерять) и назначил таблетки попить. На следующее утро я прокатился в ДМС от работы, чисто проконсультироваться - и через 5 мин после начала осмотра мне уже оперировали колено, откуда до хрена (~30 мл) гноя выкачали. И потом хирург в ДМС аккуратно поинтересовался, был ли я у врача. Услышав про посещение травмы почти 12 часов назад, спросил, отказался ли я сам от операции. И знатно охуел удивился, когда услышал, что об операции даже речи не шло. Вот тому врачу-дебилу из травмы огромный привет, блять. Нейросеть и то бы диагноз вернее поставила бы, наверно

раскрыть ветку (3)
Автор поста оценил этот комментарий

> . И если врач, дебил, назначит другое лечение - чтобы в случае ошибки ему ата-та по жопе прилетало.


Не назначит. Люди, когда им давали выбор между собственным мнением и сгенерированным, были склонны соглашаться с ИИ.

раскрыть ветку (2)
1
Автор поста оценил этот комментарий

Определение "были склонны соглашаться" не свидететльствует о 100% согласии врачей с диагнозом ИИ. В этом случае было бы уместно применить выражение "всегда соглашались".
Так вот как раз на случай, если врач считает себя умнее ИИ, хорошо бы, чтобы ему прилетал штраф и понижение в должности в случае ошибки. Сейчас у врачей такая круговая порука на местах, что даже если у ребёнка хирург на операции случайно станет причиной смерти - фиг что докажешь.
P.S. Про ребёнка, кстати, реальная история. Больница в г. Долгопрудном, в реанимации отец лежал, после инфаркта. И рассказывал, как там скрывался молодой врач-хирург (в реанимацию не врачей не пускают). После того как с бодуна делал операцию ребенку и ребенок умер, где-то он там ошибся. Скрывался в реанимации от родителей ребёнка, пил то ли спирт то ли водку, жаловался на ситуацию медсестрам. Медсестры его жалели и он трахал их за парой ширм от больных. Сука такая. На тяжелых пациентов там внимания особо не обращал никто, что они там видят. что они там слышат. Отца эта история тогда, по-моему, ощутимо так подкосила, с моральной точки зрения.

раскрыть ветку (1)
Автор поста оценил этот комментарий

Перефразирую - врачи в подавляющем большинстве случаев подписывались под тем, что диагностировал ИИ без какого-либо анализа. Потому что ИИ действительно куда чаще ставил верный диагноз, отчего доверие к машине возрастало практически до 100%.

2
Автор поста оценил этот комментарий

А ещё надо понимать, что Microsoft владеет OpenAI

Вы смотрите срез комментариев. Чтобы написать комментарий, перейдите к общему списку