图片

【导读】十多年,患者求医无果、束手无策,但将所有病史输入ChatGPT,病因竟被一眼识破:基因突变!微软、OpenAI等巨头的医疗AI已悄然登场,准确率超越专业医生!未来的医疗,或将彻底改写!

AI又一次震撼医疗圈!

一名患者被莫名病症折磨十多年,数十位医生无解。

直到他把报告输入ChatGPT——AI一语中的:MTHFR A1298C基因突变!

在Reddit上,这则消息传疯了!

图片

⚠️注意:在采纳ChatGPT建议前,该患者和主治医生多次沟通、反复确认。请一定结合专业医生意见,切勿完全依赖AI作为医疗依据。

十多年来,患者一直被各种莫名其妙的症状困扰。脊柱MRI、CT、抽血……能查的都查了,还是一头雾水。

后来,他还做了功能医学检测,意外发现他有一种纯合子突变:MTHFR基因A1298C突变。这是一种常见的亚甲基四氢叶酸还原酶MTHFR基因变异,而最常见的变异被称为MTHFR C677T。

图片

每个人都有两份MTHFR基因,分别来自母亲和父亲。上图展示了MTHFR C677T可能的基因型。而MTHFR A1298C发生在MTHFR基因的第1298位。这种突变在美国人群中影响7-12%

他还见过神经科医生,检查过是不是多发性硬化(Multiple sclerosis,MS)。

直到他把这些年所有的检查报告和病史输入ChatGPT。

神了。发生了惊人一幕:ChatGPT发现,虽然血清维生素B12水平正常,但却与持续性的神经痛和慢性疲乏矛盾。

这种反常,指向了一种长期被忽视的可能——甲基化阻滞(methylation block)。

几个月后,患者的刺痛感减轻了,大脑雾气消散了。

主任内科医生审查了治疗报告,震惊地发现,基因变异正是全部症状的病因!

AI工程师、实时追踪AGI进展的Rohan Paul,听闻此消息,大受鼓舞。他认为:「现在时机已成熟,医疗AI模型给出的第二诊疗意见应该成为医疗实践规范。」

图片

相关推文,也被OpenAI总裁转载。

图片

前Forbes撰稿人、作家Derick David则表示这是医疗界的「AlphaGo」时刻:在疾病诊断上,AI现已比人类强。

图片


图片
AI医疗奇迹,正在一幕幕上演


类似的例子太多了!

Reddit网友crasstyfartman的妹妹被ChatGPT诊断出一种罕见的遗传性血液疾病——

在此之前,她花了十多年时间看医生和自然疗法师,都被告诉那只是心理问题。他们甚至在她提出做检测时翻白眼🙄。她坚持要求检测。结果ChatGPT是对的。

图片

向医生抱怨了22年,最后网友buyableblah靠ChatGPT协助才得出诊断。

我也是这样做的,只不过是针对子宫内膜异位症(endometriosis)。终于做了超声检查,发现了一个6厘米的子宫内膜异位囊肿(称为子宫内膜瘤,endometrioma),现在已经长到7.3厘米,我打算今年晚些时候切除。


图片

甚至网友用ChatGPT拯救了被兽医「误判死刑」宠物狗。

图片

Reddit网友sometimelater0212则表达了对医疗体系的强烈不满:

我把ChatGPT提供的发现拿去给医生看,他们却全都嗤之以鼻,要么说:「从没听说过类似的诊断建议」,要么就说「别信ChatGPT」。 


 这种傲慢真是让人烦透了。


但不止OpenAI,微软、谷歌、IBM等早已布局医疗AI。

在微软的消费级AI产品中,每天就有超过5000万次与健康相关的使用情境。

从用户首次查询膝盖疼痛,到深夜紧急搜索附近诊所,搜索引擎和AI助手正逐渐成为医疗服务的第一道防线。

就在上周,微软发布了MAI-DxO。而这个AI系统表现远超医生。

图片

研究人员以《新英格兰医学杂志》(New England Journal of Medicine)每周发布的真实病例记录作为基准测试。

结果显示,在诊断NEJM病例时,Microsoft的AI诊断编排器(Microsoft AI Diagnostic Orchestrator,MAI-DxO)的准确率高达85%,这一比例是实验中经验丰富的人类医生的四倍多。

而且,MAI-DxO还比人类医生的成本低。


图片
微软:通向医疗ASI之路


NEJM每周会发表「马萨诸塞总医院病例记录」,详细记录了患者的整个诊疗过程。

这类病例通常诊断难度极高,往往需要多位专家和一系列检测手段,才能做出最终判断。

图片

NEJM:《新英格兰医学杂志》New England Journal of Medicine,是全球最权威的医学期刊之一

那么,AI在这些复杂病例中表现如何?

为探究这一问题,从NEJM案例中,微软的研究团队设计出一套交互式诊断挑战——称为「顺序诊断基准」(Sequential Diagnosis Benchmark,SD Bench)。

304个NEJM案例被转化为逐步进行的诊疗模拟:像在真实环境中一样,让AI模型或人类医生可以逐步提问、安排检测、获取结果,并实时更新诊断思路,最终给出结论。最后的结论将与NEJM给出的标准答案进行对比。

每一次检测请求都会产生虚拟费用,用以模拟真实医疗资源消耗。据此,研究人员从两个关键角度评估了模型:诊断的准确性和资源的使用效率。

图片

图1:AI智能体推理并解决顺序诊断问题的示意

输入初始病例信息,如:

29岁女性,因喉咙痛、咽旁肿胀及出血入院,使用抗菌治疗后症状未改善。


依照「顺序诊断」流程,AI开始进行推理:

(1)患者回顾病情  


(2)接下来,AI开始问诊,范围涵盖:  既往病史、用药史、恶性肿瘤迹象、病毒感染史、牙科史、出血倾向、常规实验(如血常规、凝血)和影像检查(如颈部MRI)等。  


(3)虚拟医生专家组内部讨论  


(4)逐项检查,更新诊断  


(5)AI系统得出诊断结论  


(6)与NEJM权威诊断结果对比,专家评审意见


下面的视频,项目负责人介绍了基本的流程。

图片

迈向准确诊断


研究人员对目前最具代表性的生成式AI(Generative AI)模型进行了全面评估,覆盖了304个《新英格兰医学杂志》(NEJM)的真实病例。参与评测的基础模型包括GPT、Llama、Claude、Gemini、Grok和DeepSeek等。

图片

论文链接:https://arxiv.org/abs/2506.22405v2

除了对这些模型进行基准性能测试,研究人员还设计了MicrosoftAI诊断编排器(MAI-DxO)——

模拟由多名虚拟医生组成的协作小组,通过多样化的诊断思路共同应对复杂病例的系统。

图片

图5:MAI-DxO编排系统概览

与单一模型相比,编排器不仅更善于整合不同来源的数据,还能在医疗环境变化时提供更高的安全性、透明度与适应能力。

这种不依赖于特定模型的架构(model-agnostic)也提升了系统的可审计性和韧性,这两者对于高风险、快速演进的临床场景而言至关重要。

评测结果显示,MAI-DxO显著提升了所有模型的诊断表现。其中表现最优的是MAI-DxO与OpenAI的o3模型组合,其在NEJM案例中的诊断准确率达到85.5%。

作为对比,实验中也评估了21位来自美英的执业医生,他们拥有5到20年的临床经验。在相同任务中,他们完成的案例平均准确率仅为20%。

MAI-DxO具有可配置性,可以设置成本上限,从而在诊断过程中探索「成本与价值」的权衡。

若不加限制,AI可能会倾向于开出所有可能的检查项目,而不顾费用、患者感受或诊疗延误。研究发现,MAI-DxO不仅比医生和单一模型更准确,其总体检测成本也更低。

在「诊断准确率」与「平均检测成本」两个维度上,下面的散点图对比了不同AI模型。图中MAI-DxO曲线位于表现最优的左上区域,红色叉号则代表人类医生的平均水平。

图片


图片
AI+医生:告别看病贵的第一步


医生通常在专业知识的广度或深度之间作出选择。比如,全科医生需面对不同年龄层和系统的广泛问题,而专科医生则专注于某一病种或系统。

然而,NEJM案例的复杂程度远超单一医生所能全面覆盖。而AI不受这一限制,能够兼顾广度与深度。而且在多个方面,AI的临床推理能力已超越人类医生。

这种能力有望彻底改变医疗模式——不仅可赋能患者自行处理常规健康问题,也可为医生提供决策支持。

目前,美国医疗支出占GDP的近20%,其中高达1/4属于无效支出。

AI有望成为遏制这一浪费的关键力量。

这不是取代医生,而是开启一种全新的医疗共治模式:AI+医生,共同诊断。

参考资料:https://www.reddit.com/r/ChatGPT/comments/1lrmom4/chatgpt_solved_a_10_year_problem_no_doctors_could/
https://x.com/rohanpaul_ai/status/1939800536121057652
https://x.com/rohanpaul_ai/status/1941321376838951320
https://microsoft.ai/new/the-path-to-medical-superintelligence/
https://www.cdc.gov/folic-acid/data-research/mthfr/index.html

☟☟☟

☞人工智能产业链联盟筹备组征集公告☜


精选报告推荐:

11份清华大学的DeepSeek教程,全都给你打包好了,直接领取:


【清华第一版】DeepSeek从入门到精通

【清华第二版】DeepSeek如何赋能职场应用?


【清华第三版】普通人如何抓住DeepSeek红利?

【清华第四版】DeepSeek+DeepResearch让科研像聊天一样简单?

【清华第五版】DeepSeek与AI幻觉

【清华第六版】DeepSeek赋能家庭教育

【清华第七版】文科生零基础AI编程:快速提升想象力和实操能力

【清华第八版】DeepSeek政务场景应用与解决方案

【清华第九版】迈向未来的AI教学实验

【清华第十版】DeepSeek赋能品牌传播与营销

【清华第十一版】2025AI赋能教育:高考志愿填报工具使用指南

 10份北京大学的DeepSeek教程

【北京大学第一版】DeepSeek与AIGC应用

【北京大学第二版】DeepSeek提示词工程和落地场景

【北京大学第三版】Deepseek 私有化部署和一体机

【北京大学第四版】DeepSeek原理与落地应用

【北京大学第五版】Deepseek应用场景中需要关注的十个安全问题和防范措施

【北京大学第六版】DeepSeek与新媒体运营

【北京大学第七版】DeepSeek原理与教育场景应用报告

【北京大学第八版】AI工具深度测评与选型指南

【北京大学第九版】AI+Agent与Agentic+AI的原理和应用洞察与未来展望

【北京大学第十版】DeepSeek在教育和学术领域的应用场景与案例(上中下合集)

8份浙江大学的DeepSeek专题系列教程

浙江大学DeepSeek专题系列一--吴飞:DeepSeek-回望AI三大主义与加强通识教育

浙江大学DeepSeek专题系列二--陈文智:Chatting or Acting-DeepSeek的突破边界与浙大先生的未来图景

浙江大学DeepSeek专题系列三--孙凌云:DeepSeek:智能时代的全面到来和人机协作的新常态

浙江大学DeepSeek专题系列四--王则可:DeepSeek模型优势:算力、成本角度解读

浙江大学DeepSeek专题系列五--陈静远:语言解码双生花:人类经验与AI算法的镜像之旅

浙江大学DeepSeek专题系列六--吴超:走向数字社会:从Deepseek到群体智慧

浙江大学DeepSeek专题系列七--朱朝阳:DeepSeek之火,可以燎原

浙江大学DeepSeek专题系列八--陈建海:DeepSeek的本地化部署与AI通识教育之未来

4份51CTO的《DeepSeek入门宝典》

51CTO:《DeepSeek入门宝典》:第1册-技术解析篇

51CTO:《DeepSeek入门宝典》:第2册-开发实战篇

51CTO:《DeepSeek入门宝典》:第3册-行业应用篇

51CTO:《DeepSeek入门宝典》:第4册-个人使用篇

5份厦门大学的DeepSeek教程

【厦门大学第一版】DeepSeek大模型概念、技术与应用实践

【厦门大学第二版】DeepSeek大模型赋能高校教学和科研

【厦门大学第三版】DeepSeek大模型及其企业应用实践

【厦门大学第四版】DeepSeek大模型赋能政府数字化转型

【厦门大学第五版】DeepSeek等大模型工具使用手册-实战篇

10份浙江大学的DeepSeek公开课第二季专题系列教程

【精选报告】浙江大学公开课第二季:《DeepSeek技术溯源及前沿探索》(附PDF下载)

【精选报告】浙江大学公开课第二季:2025从大模型、智能体到复杂AI应用系统的构建——以产业大脑为例(附PDF下载)

【精选报告】浙江大学公开课第二季:智能金融——AI驱动的金融变革(附PDF下载)

【精选报告】浙江大学公开课第二季:人工智能重塑科学与工程研究(附PDF下载)

【精选报告】浙江大学公开课第二季:生成式人工智能赋能智慧司法及相关思考(附PDF下载)

【精选报告】浙江大学公开课第二季:AI大模型如何破局传统医疗(附PDF下载)

【精选报告】浙江大学公开课第二季:2025年大模型:从单词接龙到行业落地报告(附PDF下载)

【精选报告】浙江大学公开课第二季:2025大小模型端云协同赋能人机交互报告(附PDF下载)

【精选报告】浙江大学公开课第二季:DeepSeek时代:让AI更懂中国文化的美与善(附PDF下载)

【精选报告】浙江大学公开课第二季:智能音乐生成:理解·反馈·融合(附PDF下载)

6份浙江大学的DeepSeek公开课第三季专题系列教程

【精选报告】浙江大学公开课第三季:走进海洋人工智能的未来(附PDF下载)

【精选报告】浙江大学公开课第三季:当艺术遇见AI:科艺融合的新探索(附PDF下载)

【精选报告】浙江大学公开课第三季:AI+BME,迈向智慧医疗健康——浙大的探索与实践(附PDF下载)

【精选报告】浙江大学公开课第三季:心理学与人工智能(附PDF下载)

【精选报告】浙江大学公开课第三季:人工智能赋能交通运输系统——关键技术与应用(附PDF下载)

【精选报告】浙江大学公开课第三季:人工智能与道德进步(附PDF下载)


相关阅读

干货推荐:
AI加油站】第一部:《大型语言模型应用检索增强生成:改变搜索、推荐和 AI 助手》附下载
【AI加油站】第二部:《程序员的自我修炼手册》(附下载)
【AI加油站】第三部:《大规模语言模型:从理论到实践》(附下载)
【AI加油站】第四部:《使用生成式人工智能和Python开始数据分析》(附下载)
【AI加油站】第五部:《使用生成式人工智能和Python开始数据分析》(附下载)
【AI加油站】第六部:《时间序列:建模、计算与推断》(附下载)
【AI加油站】第七部:《因果关系的逻辑理论的好书-A Logical Theory of Causality》(附下载)

【AI加油站】第八部:《模式识别(第四版)-模式识别与机器学习》(附下载)

【AI加油站】第九部:《Python深度学习(中文版)》(附下载)
【AI加油站】第十部:《机器学习方法》(附下载)
【AI加油站】第十一部:《深度学习》(附下载)
【AI加油站】第十二部:《从零开始的机器学习》(附下载)
【AI加油站】第十三部:《Transformer入门到精通》(附下载)
【AI加油站】第十四部:《LLM 应用开发实践笔记》(附下载)
【AI加油站】第十五部:《大模型基础 完整版》(附下载)
【AI加油站】第十六部:《从头训练大模型最佳实践》(附下载)
【AI加油站】第十七部:《大语言模型》(附下载)
【AI加油站】第十八部:《深度强化学习》(附下载)
【AI加油站】第十九部:清华大学《大模型技术》(附下载)
【AI加油站】第二十部:Prompt入门神书-《Prompt 学习指南》(附下载)
【AI加油站】第二十一部:吴恩达&open AI联合推出《大模型通关指南》(附下载)
【AI加油站】第二十二部:《李宏毅深度学习教程》值得反复阅读的神书!(附下载)
【AI加油站】第二十三部:Prompt经典中文教程-《提示工程指南》(附下载)
【AI加油站】第二十四部:爆火下载28万次!MIT最新神书《理解深度学习》(附下载)
【AI加油站】第二十五部:LLM4大名著,OpenAI专家强推《深度解析:大语言模型理论与实践》(附下载)
【AI加油站】第二十六部:NLP大牛Thomas Wolf等新书《Transformer自然语言处理》(附下载)
面试推荐:
【AI加油站】AI面试专题一:BIO,NIO,AIO,Netty面试题(附下载)
【AI加油站】AI面试专题二:Git常用命令面试题(附下载)
【AI加油站】AI面试专题三:Java常用面试题(附下载)
【AI加油站】AI面试专题四:Linux系统的面试题集(附下载)
【AI加油站】AI面试专题五:Memcached 面试题集(附下载)
【AI加油站】AI面试专题六:MyBatis框架的面试题(附下载)
【AI加油站】AI面试专题七:MySQL相关的面试题资料(附下载)
【AI加油站】AI面试专题八:Netty面试题资料(附下载)
【AI加油站】AI面试专题九:Nginx的面试题资料(附下载)
【AI加油站】AI面试专题十:RabbitMQ的面试题资料(附下载)
【AI加油站】AI面试专题十一:Redis的面试题资料(附PDF下载)
【AI加油站】AI面试专题十二:Spring的面试题资料(附PDF下载)
【AI加油站】AI面试专题十三:Apache Tomcat的面试题资料(附PDF下载)
【AI加油站】AI面试专题十四:Zookeeper的面试题资料(附PDF下载)

人工智能产业链联盟高端社区




图片
精选主题推荐:
Manus学习手册
从零开始了解Manus

DeepSeek 高级使用指南,建议收藏

一次性说清楚DeepSeek,史上最全(建议收藏)

DeepSeek一分钟做一份PPT

用DeepSeek写爆款文章?自媒体人必看指南

【5分钟解锁DeepSeek王炸攻略】顶级AI玩法,解锁办公+创作新境界!

DeepSeek接入个人微信!24小时智能助理,随时召唤!
PS×Deepseek:一句话编写PS脚本,搞定PS批量导出图层
如何让AI给自己打工,10分钟创作一条爆款视频?
荐:
【中国风动漫】《姜子牙》刷屏背后,藏着中国动画100年内幕!
【中国风动漫】除了《哪吒》,这些良心国产动画也应该被更多人知道!

【中国风动漫】《雾山五行》大火,却很少人知道它的前身《岁城璃心》一个拿着十米大刀的男主夭折!

图片
声明

免责声明:部分文章和信息来源于互联网,不代表本订阅号赞同其观点和对其真实性负责。如转载内容涉及版权等问题,请立即与小编联系(微信号:913572853),我们将迅速采取适当的措施。本订阅号原创内容,转载需授权,并注明作者和出处。如需投稿请与小助理联系(微信号:AI480908961)

编辑:Zero

图片


图片
图片

图片