369
Наука и технологии
Серия Нейро

Искусственный интеллект в разы превосходит людей в диагностике заболеваний4

Как и во многих отраслях, в медицине встречаются как хорошие, так и плохие работники. Только если, например, безалаберность сантехника обычно обходится лишь в дополнительные траты, то за неграмотность и лень докторов людям частенько приходится платить здоровьем, а то и жизнью.

Однако, уже в ближайшем будущем ситуация может измениться — врачей может заменить искусственный интеллект. А если ещё точнее — он, в принципе, уже готов их заменить, дело за самими людьми.

Компания Microsoft провело исследование, в рамках которого тестировались возможности современных нейросетей правильно диагностировать различные заболевания. В тестах участвовали разные вариации GPT, Llama, Claude, Gemini, Grok и DeepSeek. Кроме того, поверх выбранных нейросетей работала специальная система Microsoft AI Diagnostic Orchestrator (MAI-DxO), которая имитировала консилиум специалистов.

Тестирование проходило на 304 реальных клинических случаях разной степени сложности: начиная от банального коронавируса и заканчивая тяжёлыми и редкими поражениями разных органов. Так как модели обучались на данных, собранных из интернета, в выборку включили 56 случаев, которые произошли уже после завершения обучения всех моделей.

Со стороны людей участвовали 21 практикующих врача из США и Великобритании с опытом работы по специальности в 5-20 лет. Чтобы уравняться с нейросетями, врачам нельзя было использовать никаких дополнительных источников, только свои собственные знания.

В конце тестирования оценивались как нейросети, так и люди — исследователи смотрели, смогли ли участники эксперимента вывести виртуального пациент на правильный диагноз.

«Беседа» с пациентом проходила в формате свободного тестового чата: и люди и нейросети получали одну и ту же вводную информацию, а потом были вольны задавать дополнительные вопросы, назначать любые исследования и анализы без ограничений.

В итоге оказалось, что нейросети даже общей направленности на голову превзошли врачей. Для людей средний уровень точности в постановке диагноза составил около 20%, а вот среди нейросетей даже простенькая и совершенно устаревшая уже GPT-3.5 Turbo оказалась лучше большинства специалистов:

Искусственный интеллект в разы превосходит людей в диагностике заболеваний

Кроме того, нейросети сильно экономили бюджет. В среднем врачам понадобилось 2963 доллара на диагноз при точности в 20%. При сопоставимых расходах GPT-4o показывала точность в 50%. Ну и чем больше нейросетям выделяли бюджет на анализы и исследования, тем точнее они диагностировали заболевания. У людей такого не наблюдалось — при увеличении бюджета точность диагностики кожаных не повышалась.

Ещё очень хорошо себя показала система MAI-DxO: с нулевым бюджетом, только основываясь на жалобах пациента она смогла поставить диагноз точнее, чем практически все врачи с тратами на анализы и обследования.

В целом доработанная система, работавшая в связке с нейросетями общего назначения показала максимальную точность в 81,9% при ограничениях в бюджете. Если же позволить системе ни в чём себя не ограничивать, то она ставила правильный диагноз в 85,5% случаев.

В общем, в одиночку отдельно взятый врач с немалым опытом работы даже близко не способен приблизиться к точности нейросети. Забороть желязяку даже на данном этапе может только консилиум кожаных, изрядно при этом потратившись на диагностику.

При этом, несмотря на то, что люди с треском проиграли нейросетям, принимавшие участие в эксперименте врачи считают, что искусственный интеллект лишь дополняет докторов и других медицинских специалистов.

P.S. Ещё у меня есть бессмысленные и беспощадные ТГ-каналы (ну а как без них?):

О науке, творчестве и прочей дичи: https://t.me/deeplabscience;

Вот тут про молекулярную биологию, медицину и новые исследования: https://t.me/nextmedi.

Наука и технологии

59 постов20 подписчиков

Правила сообщества

1. Никакого нейросетевого творчества, только авторские посты 2. Политика/религия под запретом

12
Автор поста оценил этот комментарий

Если бы Вы хоть чуть-чуть умели в IT а не только перепечатывать хайпожорские научпоп статейки попутно нагоняя трафик в телеграм-канал, то слышали бы про так называемые "галлюцинации ИИ". После чего желания лечиться у роботов бы сильно поубавилось.

раскрыть ветку (1)
3
Автор поста оценил этот комментарий

Вы так говорите, как будто люди не "галлюционируют", а делают идеально всё. На Пикабу полно историй, когда люди творили лютую дичь, не сподобившись распознать даже аппендицит.

показать ответы
Автор поста оценил этот комментарий
Их не смущает что эти ии галлюцинируют и начинают выдумывать то , чего нет ?
раскрыть ветку (1)
1
Автор поста оценил этот комментарий

Смущает. Как, например, пациентов очень смущает, когда врачи не могут поставить диагноз.

показать ответы
7
Автор поста оценил этот комментарий
Отлично. Значит, можно валить из профессии, получить новое образование и начать заниматься тем, что ИИ не может. Например, пошивом/вышивкой на заказ, работать садовником или ремонтировать дизельные двигатели. Нервов тратится меньше, работа интересная.
раскрыть ветку (1)
1
Автор поста оценил этот комментарий

Вообще да, такая вот ручная работа будет автоматизирована одной из последних.

0
Автор поста оценил этот комментарий

Нет, в исследовании ограничивали врачей, больше чем нейросети. Это было заложено в дизайне. Не учли фактор сбора информации. Нейросети и врачи работали с той что есть, а врачам доступ к интернету закрыли.

раскрыть ветку (1)
0
Автор поста оценил этот комментарий

Киньте цитатой.

0
Автор поста оценил этот комментарий

С точки зрения эксперимента исследование - полная шляпа. 1)врачам и ИИ давали одинаковую информацию. 70 % сложности работы врача - выудить у пациента информацию. 90% пациентов обращают внимание на то что не важно и скрывают (не специально конечно) действительно значитмые симптомы. 2)кожаным запрещено было использовать компьютер. То есть врач должен знать и помнить наизусть все референсные интервалы редких исследований и стандарты обследований при разных нозологиях (а это как раз и нужно и можно смотреть в сети) а у ИИ полный набор этой информации. Это как выставить математика доказывающего сложную теорему против калькулятора и делать арифметические действия. Калькулятор будет быстрее и точнее.

При таких условиях сравнения -дальше не интересно.

раскрыть ветку (1)
0
Автор поста оценил этот комментарий

Исследование было на это и направлено - сравнить чистую "производительность" врачей и нейросетей.

Никто не будет ограничивать нейросети ради того, чтобы врачи не чувствовали себя ущемлёнными.

показать ответы
1
Автор поста оценил этот комментарий

А вы мой комментарий читали? Выборка в 300 случаев в строго контролируемых "тепличных" - очуметь какой результат.

Хотя к чему спорить, пару лет осталось подождать, обследуйтесь и лечитесь у ИИ, ради Бога, я нисколько не против, даже за

раскрыть ветку (1)
0
Автор поста оценил этот комментарий

Да, в общем-то, уже ИИ выдаёт результаты и ставит диагнозы лучше, чем средний врач.

1
Автор поста оценил этот комментарий

Во-первых, напомните пожалуйста, какой процент галлюцинаций и ИИ?) во-вторых, диагностика, конечно, хорошо, но доверять назначение лечения ИИ, особенно галлюцинирующему, без контроля врача - крайне сомнительная идея.


А вообще, вырисовывается довольно занятная перспектива здравоохранения ближайшего будущего: для масс будет дистанционная ИИ-медицина, основная на клинических рекомендациях "а-ля докмед", в которые будут входить, да и сейчас уже входят, те препараты, которые проллобировали производители (привет Фармстандарту с мадам Голиковой и производителям гомеопатических препаратаов). А для элиты, богатого меньшинства, будет персонифицированная и превентивная медицина с реальными врачами в комфортных условиях частных медицинских центров. Пусть и с применением ИИ, но на второстепенных ролях, в качестве инструмента помощи принятия решений


О так вот

раскрыть ветку (1)
0
Автор поста оценил этот комментарий

Ох уж эти галлюцинации... вы пост-то читали? Там вроде приведены цифры точности людей и нейросетей.

показать ответы
1
Автор поста оценил этот комментарий
1) Я прочитал оригинальное исследование. И там прямо написано, что бенчмарк давал ИИ информацию в соответствии с публикацией в New England Journal of Medicine. Повторюсь: пациент не придёт к вам с описанием своего случая, изложенным и систематизированным как в журнале. Вытягивать из него всё придется самостоятельно. Именно вытягивать. Потому что многие вещи люди не хотят рассказывать, или не знают, как правильно это сделать.
2) Если вы считаете, что грамотность и систематизированность информации не влияет на точность работы ИИ, то не вижу смысла дальше с вами спорить.
3) Ниже цитата из исследования, подтверждающая правильность моей позиции. И прошу заметить, это сказали врачи, участвовавшие в разработке, а не те, кто в нем участвовали, как вы вывернули в своей статье:
Will AI replace doctors?
While AI is becoming a powerful tool in healthcare, our team of practicing clinicians believes AI represents a complement to doctors and other health professionals. While this technology is advancing rapidly, their clinical roles are much broader than simply making a diagnosis. They need to navigate ambiguity and build trust with patients and their families in a way that AI isn’t set up to do.
А ваш пост - либо для рекламы, либо для хайпа на популярной теме.
раскрыть ветку (1)
0
Автор поста оценил этот комментарий

Что я могу на это сказать? Прочитайте исследование ещё раз, только внимательно.

показать ответы
0
Автор поста оценил этот комментарий

"Чтобы уравняться с нейросетями, врачам нельзя было использовать никаких дополнительных источников, только свои собственные знания"

Вот сразу мимо.

Нейронка по сути имеет библиотеку.

раскрыть ветку (1)
0
Автор поста оценил этот комментарий

А что не так? Сравнивали именно что чистые знания нейронки и врача, обучались и та и тот.

показать ответы
4
Автор поста оценил этот комментарий
"И люди и нейросети получали одну и ту же вводную информацию". Думаю тут и кроется нюанс, с помощью которого Мелкософт стряпал результаты. По чёткой, систематизированно поданной информации с большим количеством подробностей ИИ ожидаемо справится лучше. Тем более что врачей лишили доступа к справочной информации. Вот только пациент не приходит к тебе с готовым эпикризом на 4 листа. Он приходит и говорит: "Заебало кашлять, дай таблетку". А на все уточняющие вопросы отвечает: "Я мочу с детства пью, абсолютно здоров, заебал всякую хуету спрашивать, я не на допрос пришёл, дай таблетку".
Удачи ИИ с таким гражданином.
Я конечно утрирую, но смысл, думаю, понятен. 90% диагностики - это не интерпретировать информацию, а правильно её собрать.
раскрыть ветку (1)
0
Автор поста оценил этот комментарий

Прочитайте оригинальное исследование, там не было никаких подробностей. Не говоря уже о том, что какая разница, как она была систематизирована?

показать ответы
3
Автор поста оценил этот комментарий
А на выходные за яблоками на Марс слетаем.
раскрыть ветку (1)
0
Автор поста оценил этот комментарий

Это к Маску, обещал по профсоюзным путёвкам возить, да вот что-то не то.

показать ответы
9
Автор поста оценил этот комментарий

Я, кстати, только за, чтобы нейросеть советовала врачу при первичном осмотре. И чтобы эта информация (рекомендации нейросети), записывались в диагнозе. И если врач, дебил, назначит другое лечение - чтобы в случае ошибки ему ата-та по жопе прилетало.

P.S. Сорри за эмоции, навеяло из прошлого. Был гнойный бурсит в колене месяцев 8 назад. Врач в бесплатной травме ни хрена не опознал (хотя колено пухло на глазах, и я нашатырь просил, чтоб сознание от радости не потерять) и назначил таблетки попить. На следующее утро я прокатился в ДМС от работы, чисто проконсультироваться - и через 5 мин после начала осмотра мне уже оперировали колено, откуда до хрена (~30 мл) гноя выкачали. И потом хирург в ДМС аккуратно поинтересовался, был ли я у врача. Услышав про посещение травмы почти 12 часов назад, спросил, отказался ли я сам от операции. И знатно охуел удивился, когда услышал, что об операции даже речи не шло. Вот тому врачу-дебилу из травмы огромный привет, блять. Нейросеть и то бы диагноз вернее поставила бы, наверно

раскрыть ветку (1)
Автор поста оценил этот комментарий

> . И если врач, дебил, назначит другое лечение - чтобы в случае ошибки ему ата-та по жопе прилетало.


Не назначит. Люди, когда им давали выбор между собственным мнением и сгенерированным, были склонны соглашаться с ИИ.

показать ответы
1
Автор поста оценил этот комментарий

Определение "были склонны соглашаться" не свидететльствует о 100% согласии врачей с диагнозом ИИ. В этом случае было бы уместно применить выражение "всегда соглашались".
Так вот как раз на случай, если врач считает себя умнее ИИ, хорошо бы, чтобы ему прилетал штраф и понижение в должности в случае ошибки. Сейчас у врачей такая круговая порука на местах, что даже если у ребёнка хирург на операции случайно станет причиной смерти - фиг что докажешь.
P.S. Про ребёнка, кстати, реальная история. Больница в г. Долгопрудном, в реанимации отец лежал, после инфаркта. И рассказывал, как там скрывался молодой врач-хирург (в реанимацию не врачей не пускают). После того как с бодуна делал операцию ребенку и ребенок умер, где-то он там ошибся. Скрывался в реанимации от родителей ребёнка, пил то ли спирт то ли водку, жаловался на ситуацию медсестрам. Медсестры его жалели и он трахал их за парой ширм от больных. Сука такая. На тяжелых пациентов там внимания особо не обращал никто, что они там видят. что они там слышат. Отца эта история тогда, по-моему, ощутимо так подкосила, с моральной точки зрения.

раскрыть ветку (1)
Автор поста оценил этот комментарий

Перефразирую - врачи в подавляющем большинстве случаев подписывались под тем, что диагностировал ИИ без какого-либо анализа. Потому что ИИ действительно куда чаще ставил верный диагноз, отчего доверие к машине возрастало практически до 100%.

3
Автор поста оценил этот комментарий

Потому что быстрый выбор из симптоматики и результатов обследований - чисто технически нейросеть быстрее. Поэтому - нейросеть в медицине, ВЕРОЯТНО станет обязательным вспомогательным консультантом врача, ну и не забываем про хирургов - парни и девушки, вам отдельный поклон.

раскрыть ветку (1)
Автор поста оценил этот комментарий

Нейросети уже становятся главными диагностами, а врачи их лишь дополняют.