华为、蚂蚁等大厂正在加码布局AI医疗健康。
6月30日,瑞金医院宣布与华为开源了病理大模型“RuiPath”, 并与海内外的12家医疗机构共同启动RuiPath病理大模型的全球多中心计划,协同推动病理大模型持续迭代。
蚂蚁集团在收购好大夫后,持续布局AI医疗。最新推出的AI健康应用“AQ”,提供健康科普、就诊咨询、报告解读、健康档案等上百项AI功能。
此外,科大讯飞、百川、Kimi等也纷纷看中了AI医疗这一赛道。从落地场景来看,名医智能体、AI诊疗、新药研发等是被重点关注的方向。
弗若斯特沙利文预测,中国AI医疗市场规模将从2023年的88亿元增至2033年的3157亿元,年复合增长率达43.1%。
不过,《科创板日报》记者在采访中获悉,高质量的医疗数据缺乏,以及数字化建设成本高昂等,仍在一定程度上影响了AI在医疗领域的应用。
▍AI智能体落地:为名医打造数字分身
AI应用于医疗服务,已经有很长一段时间。但此前小模型由于其泛化能力有限。
蚂蚁集团AI医疗总经理刘军伟认为,大模型时代与此前阶段的区别在于,AI将成为生产力。比如,医生AI分身既可以帮助医生解决问题,也可以快速响应用户的需求。蚂蚁集团的AI健康应用AQ,就整合了全国近200位名医“AI分身”。
“偏远地区的老百姓,如果要想挂到大专家号,甚至进行在线专家问诊,是很困难的。通过AI能力打造专家医生分身,偏远山区的老百姓就可以享受24小时随时沟通。在不影响工作的情况下,专家也可以收到很多用户的反馈或者用户的需求。”
刘军伟介绍,为专科名医打造AI分身,不仅需要形象和声音相似,关键环节在于大模型对医生科室诊疗经验的针对性学习,让智能体真正接近医生本人的问诊逻辑,这是在训练模型、安全评估等一系列深度合作中完成的。当AI涉及到诊疗诊断等深入问题时,AI会为用户匹配医生来做二次判断,在有必要时建议挂号就诊。
“我们希望AI扮演把所有类型的服务串联起来的角色。大模型的关键进化还在于改变了交互方式,不需要任何门槛,一句话就可以。AI主要做的是咨询,可以帮你直接唤起互联网医院和线下的陪诊。”
▍大模型能否走入临床应用?
华为于今年3月组建了医疗卫生军团。《科创板日报》记者了解到,华为希望大模型不止于问答咨询,而是能直接在医生的诊断环节发挥作用。
此次瑞金医院与华为打造的RuiPath病理大模型,正是AI在诊断方面的一大探索。该模型是基于对百万数字病理切片等数据进行训练,能识别病理切片中的病灶区域。
中国工程院院士、上海交通大学医学院附属瑞金医院院长宁光认为,AI真正走向实际临床应用,是医疗行业有待跨出的、非常重要的一步。“我们为什么一直在发布,临床总是不应用?这是所面临的非常重要的问题。”
这是为何瑞金医院选择开源RuiPath病理大模型。目前RuiPath超越传统小模型,已覆盖19个常见癌种,覆盖中国每年全癌种发病人数90%的癌种。但在宁光看来,还有10%肿瘤未能覆盖。
“我们能否通过开源的方式,真正可以覆盖百分之百的癌种。只有这样才可能达到临床应用级的大模型,这就需要大家一起来提高和打磨。”
在宁光的期望里,应该集上海所能、集上海所强,所有医院一起合作攻关,这样才可以在上海形成垂直化大模型生态。
“在卫健委和上海申康医院发展中心的支持和领导下,可以有更多的医院、更多的模型。而每家医院对别家医院的模型,都给予更多的关心支持和率先的使用。相信这样就真正可以看到,不是一家一家医院在发布、在使用,而是整个上海在使用。也只有如此,才可能提高垂直化医学大模型在上海乃至全国,甚至全球的应用。”
▍数据仍是最大挑战
瑞金医院病理科主任助理笪倩表示,在病理人工智能的落地过程当中存在多重挑战,比如数据切片和扫描的质量不合格,会影响模型的精度,数据格式不统一就会形成数据孤岛。
笪倩提到,中国约有5000家医院具有病理科,但不足5%的医院将数字化应用于日常的诊断过程当中,导致数据的规模很小,影响了智慧化的发展。
在算法的层面上,传统的模式数据标注依赖于病理学的专业知识,导致非常的昂贵而费时,并且具有个人的主观性。
笪倩称,在算力层面上,100万张的切片对应的是一个PB的数据,单张的主流GPU显存仅为80个GB,这导致投资成本很高。在存力方面,三甲医院病理数据的增量非常大,也使得存储的成本非常高,数字化建设的门槛高居不下。以瑞金医院为例,每天的增长切片量为6000张,所以每年的数据增量达到1.5个PB。
望石智慧创始人&CEO 周杰龙认为,医药创新的问题分为水面之上和水面之下:水面之上是研发挑战的问题,创新难度大,怎么突破创新的过程,避免“专利撞车”;水面之下,医药行业作为数据密集型产业,很多药企有非常多数据,但今天这些数据沉积在很多数据仓里,没有实现数据价值最大化。
“相对于其他行业,医药领域在数字化层面可能更偏落后,面临更大的挑战:一方面,业务每个环节的数据记录可能未必规范,导致很多的数据之间没有打通,或由于保密性原因无法办法共享,导致数据浪费,知识无法沉淀。另一方面,对于工具层面,虽然目前已经有非常多的工具,但这些工具就好像散布在系统里面的一个个点,没有形成从设计目标出发,构建一条系统化的工具链。”周杰龙表示。
望石智慧也在与亚马逊云科技等厂商合作,推进数据治理方面的技术探索,包括:数据结构化治理、模型输入/输出安全控制策略、基础设施和各种高性能计算平台的支持等。
周杰龙表示,在医药领域里,需要训练和学习化学、生物、模态医药的垂类大模型,基于底层的垂类生成模型,再融合文本模型,最终走向智能体(Agent)之路。通过多个智能体(Multi-agents)的方式提高集体智能和决策的方式。