上证报中国证券网讯(记者孙小程)10月22日,百川智能发布循证增强医疗大模型Baichuan-M2 Plus,同步升级配套应用百小应并开放API。这是百川自8月开源Baichuan-M2以来的又一次重要动作。
评测显示,M2 Plus的医疗幻觉率较通用大模型显著降低,相比DeepSeek低约3倍,优于美国最火医疗产品OpenEvidence。
循证医学作为现代医学知识体系的核心范式,是确保医疗决策可信的关键。通用大模型像一个“博学但不可靠”的专家,即便有搜索增强,也会因为知识来源混杂不符合循证医学范式。
为解决这一问题,百川不仅主动屏蔽互联网上的非专业信息来源,只使用权威来源的医学证据,还在此基础上构建了从证据、到实践、再到真实世界反馈六层证据类型的知识。
同时,M2 Plus采用PICO框架(人群Population、干预Intervention、对照Comparison、结局Outcome)思维,将查询转化为结构化医学问题,并在六源数据库中进行分层匹配。
如果说“六源循证”解决了医疗AI知识从哪来的问题,“PICO智能检索”解决了如何快速找到正确证据的问题,那么最关键的一步是如何确保AI在手握证据时不会“自由发挥”、脱离事实胡乱回答。
百川智能在M2 Plus中引入“循证增强训练”机制,为模型的回答“上了一道锁”,从根本上改变了其生成逻辑,让它学会“引用,而非臆测”。具体包括:
首先,在训练中奖励“引用”,惩罚“臆测”。准确引用权威来源(如指南、文献)时会获得高分,一旦回答脱离检索到的证据就会受到惩罚;
其次,内置“证据评估器”。模型被训练得能够自动评估检索到的证据质量,优先采纳高可信度的信息,并将其无缝嵌入推理链;
第三,句句有据,可回溯、可验证。经过训练,M2-Plus的回答风格发生了根本性改变,在输出关键结论时,会自动附上参考文献、指南出处等来源,这赋予了AI回答更高的可解释性与可信赖度。