Ключевое отличие таких систем — способность к многошаговому рассуждению. В отличие от классических LLM вроде GPT-4, модель анализирует несколько гипотез, проверяет их и корректирует вывод перед финальным ответом. Это приближает её к клиническому мышлению, где диагноз формируется через последовательное исключение альтернатив.
В контролируемых тестах на базе клиникопатологических кейсов из New England Journal of Medicine модель достигла точности около 89% для правильного или близкого диагноза, тогда как GPT-4 показал около 73%. Особенно заметен разрыв на сложных случаях — редких инфекциях, аутоиммунных заболеваниях и кардиологических патологиях.
Наиболее показательной стала проверка в условиях, приближенных к реальности. В 70 кейсах из отделений неотложной помощи модель превзошла врачей на ранней стадии — при триаже, где критически важно быстро определить приоритетный диагноз пациента при дефиците информации. Более того, в «слепой» оценке эксперты не смогли стабильно отличить выводы ИИ от решений клиницистов.
При этом исследование подчёркивает: речь не идёт о замене врачей. Диагностика — лишь часть клинической практики, которая включает физический осмотр, коммуникацию с пациентом и принятие этических решений. Кроме того, модель работала исключительно с текстовыми данными, тогда как реальная медицина опирается на визуальные, аудиальные и поведенческие признаки.
Следующий этап — переход к мультимодальным системам, таким как Gemini 3.1 Pro и новые поколения моделей OpenAI, способных анализировать изображения, звук и видео. Это потенциально приближает ИИ к полноценной клинической среде, но требует строгих испытаний.
Эксперты, включая исследователей из Университет Флиндерса, отмечают: демонстрация высокой точности в тестах — лишь первый шаг. Для внедрения в здравоохранение необходимы клинические испытания, оценка безопасности, устойчивости к ошибкам и отсутствия системных предвзятостей.
Фактически отрасль входит в новую фазу: ИИ уже способен усиливать принятие решений в самых сложных и неопределённых сценариях. Однако главный вопрос смещается с «насколько точен ИИ» к «насколько безопасно и корректно он интегрируется в клиническую практику».
Источник: https://singularityhub.com/2026/05/04/an-ai-just-beat-doctors-at-diagnosing-er-patients/
Если вам понравился материал, кликните значок — вы поможете нам узнать, каким статьям и новостям следует отдавать предпочтение. Если вы хотите обсудить материал —не стесняйтесь оставлять свои комментарии : возможно, они будут полезны другим нашим читателям!

