369
Наука и технологии
Серия Нейро

Искусственный интеллект в разы превосходит людей в диагностике заболеваний4

Как и во многих отраслях, в медицине встречаются как хорошие, так и плохие работники. Только если, например, безалаберность сантехника обычно обходится лишь в дополнительные траты, то за неграмотность и лень докторов людям частенько приходится платить здоровьем, а то и жизнью.

Однако, уже в ближайшем будущем ситуация может измениться — врачей может заменить искусственный интеллект. А если ещё точнее — он, в принципе, уже готов их заменить, дело за самими людьми.

Компания Microsoft провело исследование, в рамках которого тестировались возможности современных нейросетей правильно диагностировать различные заболевания. В тестах участвовали разные вариации GPT, Llama, Claude, Gemini, Grok и DeepSeek. Кроме того, поверх выбранных нейросетей работала специальная система Microsoft AI Diagnostic Orchestrator (MAI-DxO), которая имитировала консилиум специалистов.

Тестирование проходило на 304 реальных клинических случаях разной степени сложности: начиная от банального коронавируса и заканчивая тяжёлыми и редкими поражениями разных органов. Так как модели обучались на данных, собранных из интернета, в выборку включили 56 случаев, которые произошли уже после завершения обучения всех моделей.

Со стороны людей участвовали 21 практикующих врача из США и Великобритании с опытом работы по специальности в 5-20 лет. Чтобы уравняться с нейросетями, врачам нельзя было использовать никаких дополнительных источников, только свои собственные знания.

В конце тестирования оценивались как нейросети, так и люди — исследователи смотрели, смогли ли участники эксперимента вывести виртуального пациент на правильный диагноз.

«Беседа» с пациентом проходила в формате свободного тестового чата: и люди и нейросети получали одну и ту же вводную информацию, а потом были вольны задавать дополнительные вопросы, назначать любые исследования и анализы без ограничений.

В итоге оказалось, что нейросети даже общей направленности на голову превзошли врачей. Для людей средний уровень точности в постановке диагноза составил около 20%, а вот среди нейросетей даже простенькая и совершенно устаревшая уже GPT-3.5 Turbo оказалась лучше большинства специалистов:

Искусственный интеллект в разы превосходит людей в диагностике заболеваний

Кроме того, нейросети сильно экономили бюджет. В среднем врачам понадобилось 2963 доллара на диагноз при точности в 20%. При сопоставимых расходах GPT-4o показывала точность в 50%. Ну и чем больше нейросетям выделяли бюджет на анализы и исследования, тем точнее они диагностировали заболевания. У людей такого не наблюдалось — при увеличении бюджета точность диагностики кожаных не повышалась.

Ещё очень хорошо себя показала система MAI-DxO: с нулевым бюджетом, только основываясь на жалобах пациента она смогла поставить диагноз точнее, чем практически все врачи с тратами на анализы и обследования.

В целом доработанная система, работавшая в связке с нейросетями общего назначения показала максимальную точность в 81,9% при ограничениях в бюджете. Если же позволить системе ни в чём себя не ограничивать, то она ставила правильный диагноз в 85,5% случаев.

В общем, в одиночку отдельно взятый врач с немалым опытом работы даже близко не способен приблизиться к точности нейросети. Забороть желязяку даже на данном этапе может только консилиум кожаных, изрядно при этом потратившись на диагностику.

При этом, несмотря на то, что люди с треском проиграли нейросетям, принимавшие участие в эксперименте врачи считают, что искусственный интеллект лишь дополняет докторов и других медицинских специалистов.

P.S. Ещё у меня есть бессмысленные и беспощадные ТГ-каналы (ну а как без них?):

О науке, творчестве и прочей дичи: https://t.me/deeplabscience;

Вот тут про молекулярную биологию, медицину и новые исследования: https://t.me/nextmedi.

Наука и технологии

59 постов20 подписчиков

Правила сообщества

1. Никакого нейросетевого творчества, только авторские посты 2. Политика/религия под запретом

Вы смотрите срез комментариев. Показать все
4
Автор поста оценил этот комментарий
"И люди и нейросети получали одну и ту же вводную информацию". Думаю тут и кроется нюанс, с помощью которого Мелкософт стряпал результаты. По чёткой, систематизированно поданной информации с большим количеством подробностей ИИ ожидаемо справится лучше. Тем более что врачей лишили доступа к справочной информации. Вот только пациент не приходит к тебе с готовым эпикризом на 4 листа. Он приходит и говорит: "Заебало кашлять, дай таблетку". А на все уточняющие вопросы отвечает: "Я мочу с детства пью, абсолютно здоров, заебал всякую хуету спрашивать, я не на допрос пришёл, дай таблетку".
Удачи ИИ с таким гражданином.
Я конечно утрирую, но смысл, думаю, понятен. 90% диагностики - это не интерпретировать информацию, а правильно её собрать.
раскрыть ветку (4)
0
Автор поста оценил этот комментарий

Прочитайте оригинальное исследование, там не было никаких подробностей. Не говоря уже о том, что какая разница, как она была систематизирована?

раскрыть ветку (3)
1
Автор поста оценил этот комментарий
1) Я прочитал оригинальное исследование. И там прямо написано, что бенчмарк давал ИИ информацию в соответствии с публикацией в New England Journal of Medicine. Повторюсь: пациент не придёт к вам с описанием своего случая, изложенным и систематизированным как в журнале. Вытягивать из него всё придется самостоятельно. Именно вытягивать. Потому что многие вещи люди не хотят рассказывать, или не знают, как правильно это сделать.
2) Если вы считаете, что грамотность и систематизированность информации не влияет на точность работы ИИ, то не вижу смысла дальше с вами спорить.
3) Ниже цитата из исследования, подтверждающая правильность моей позиции. И прошу заметить, это сказали врачи, участвовавшие в разработке, а не те, кто в нем участвовали, как вы вывернули в своей статье:
Will AI replace doctors?
While AI is becoming a powerful tool in healthcare, our team of practicing clinicians believes AI represents a complement to doctors and other health professionals. While this technology is advancing rapidly, their clinical roles are much broader than simply making a diagnosis. They need to navigate ambiguity and build trust with patients and their families in a way that AI isn’t set up to do.
А ваш пост - либо для рекламы, либо для хайпа на популярной теме.
раскрыть ветку (2)
0
Автор поста оценил этот комментарий

Что я могу на это сказать? Прочитайте исследование ещё раз, только внимательно.

раскрыть ветку (1)
0
Автор поста оценил этот комментарий
То есть, другими словами, сказать вам больше нечего.
Вы смотрите срез комментариев. Чтобы написать комментарий, перейдите к общему списку