国内首个!夸克健康大模型通过主任医师评测:行业上限更高了
- 2025-07-24 18:30:00

来源:雷科技AI硬件组 | 编辑:茶督掌柜
7月23日,夸克健康大模型成功通过中国12门核心学科的主任医师笔试评测,成为国内首个完成这一挑战的大模型。这是继5月通过副主任医师职称考试后,夸克健康大模型的又一次能力跃升。目前,“主任级AI医生”能力已经全面集成在夸克的AI搜索里,查询健康问题的时候,选择深度搜索就可以调用。
之所以是垂类大模型,原因很简单。一方面,垂类大模型相比通用大模型有更强的单一场景专业性,根据夸克公布的数据,在医疗场景下的性能比较,夸克健康大模型的答题正确率,全面超越了通用大模型DeepSeek。这并不是说通用大模型性能不行,只是“术业有专攻”,针对单一场景的垂类大模型,明显会更适合。
另一方面,对于专业领域,AI大模型要面对的是各种各样的问题,这意味着单一的数据库回答并不可靠,尤其是医学领域。举个例子,每一位病人都是感冒,但不同的人会有不同的症状表现,症状的轻重也各有不同,甚至还有一定的并发症和过敏等因素伴随,医生就需要根据病人的症状描述“对症下药”。
因此,垂类大模型不仅要“知识丰富”,更要“会思考”,夸克健康大模型以通义千问为基础,走出了一条面向垂直场景的工程化路线。夸克算法负责人表示:“我们不是在训练AI回答医学问题,而是在训练它学会医学思维。”换句话说,医学垂类大模型不能是AI“闭门造车”,更多的还是和真实医生一同共创。

(图片来自夸克)
而夸克健康大模型的核心突破之一,就是“慢思考”能力。这项能力融合了链式推理和多阶段临床演绎路径建模,驱动模型在面对复杂医疗问题时,能够分阶段、层层深入地推推导出最终回答。
所谓的“医学思维”并非单方面的知识库或者推理能力,夸克健康大模型的思考,是基于高质量训练数据的。为此,夸克构建了“双数据产线+双奖励机制”的工程体系,将医学数据划分为“可验证”和“不可验证”两类,分别对应诊断类任务和健康建议类任务。另外,在训练方法上,夸克引入了“过程奖励模型”和“结果奖励模型”,确保推导过程和最终结果的合理性和准确性。
为了避免AI大模型为了高分而做题而应试行为,夸克健康大模型还设计了多阶段强化学习流程,通过真实医生标注、提问——思考——回答整组数据驱动强化学习,让夸克健康大模型成为了“不读死书”,拥有真正医学思维的AI大模型。
得益于在医学领域的专业性,夸克健康大模型得到了不少专业医师的认可,比如安贞医院心脏外科主任医师谢进生表示,夸克在一些问题上回答的专业度比专业医生更强。同时夸克AI搜索吸引了一大批医学生和医生群体,目前平台在全国医学生中月活用户已突破200万,覆盖率过半,这就是夸克健康大模型在医学领域专业性的证明。
这次夸克健康大模型证明了自己更高的能力上限,但这不是AI大模型的终点。医学大模型除了要在专业领域上不断精进,从应用层面去看,更应该让更多普通用户享受到“人均专业医师”的专业咨询。
欢迎扫码添加小雷微信
记得备注想进群的手机品牌哦
跟小雷一起畅聊数码与科技

另外小雷建了几个粉丝群,欢迎扫码加入!
大家伙一块聊聊天,分享玩机技巧~







- 点赞 (0)
-
分享
微信扫一扫
-
加入群聊
扫码加入群聊