4月25日,在Create2025百度AI开发者大会上,百度对外发布文心大模型4.5 Turbo及深度思考模型X1 Turbo两大模型以及多款AI应用。当日,百度首席技术官王海峰从基础模型、后训练、深度思考和数据等方面解读了文心4.5 Turbo和X1 Turbo的关键技术。
王海峰表示,文心4.5和4.5 Turbo都是多模态大模型,实现了文本、图像和视频的混合训练。针对不同模态数据在结构、规模、知识密度上的差异,通过多模态异构专家建模、自适应分辨率视觉编码、时空重排列的三维旋转位置编码、自适应模态感知损失计算等技术,大幅提升跨模态学习效率和多模态融合效果,学习效率提高近2倍,多模态理解效果提升超过30%。
后训练方面,百度研制了自反馈增强的技术框架,基于大模型自身的生成和评估反馈能力,实现了“训练-生成-反馈-增强”的模型迭代闭环,不仅解决了大模型对齐过程中,数据生产难度大、成本高、速度慢等问题,而且显著降低了模型幻觉,模型理解和处理复杂任务的能力大幅提升。
深度思考方面,突破了仅基于思维链优化的范式,在思考路径中结合工具调用,构建了融合思考和行动的复合思维链,模型解决问题能力得到显著提升。
据了解,基于文心大模型的语言和代码能力,百度研制了代码智能体和智能代码助手——“文心快码”。目前百度每天新增的代码中,文心快码生成的代码占比已超过40%。最新数据显示,文心快码向全社会开放,累计服务760万开发者。

王海峰提及,文心大模型的能力拓展和效率提升,得益于飞桨文心的联合优化。例如训练方面,多模态统一的掩码注意力加速,在不同模态混合计算注意力时,显著降低掩码构建和计算开销,大幅提升训练性能;推理方面,多模态流式分块预填充机制,减少首token耗时,同时减少推理计算的显存峰值,提升推理批次大小,提升吞吐性能。通过这些联合优化技术,文心4.5 Turbo训练吞吐达到文心4.5的5.4倍,推理吞吐达到8倍。
截至目前,飞桨文心开发者数量已超过2185万,服务超过67万家企业,创建的模型达到110万。
首个“非遗武术大模型”发布
随着AI加速进步,大模型在千行百业的应用也越来越深入。记者了解到,在文博领域,百度与中国文物交流中心达成深度合作,增强大模型在文博领域专业知识,并发布首个文博智能体,让每个人都成为文博传承的参与者与受益者;在非遗武术传承领域,百度与上海体育大学武术学院、中国武术博物馆联合发布“非遗武术——百度文心大模型”,基于文心大模型,将武术技法与算法结合,将非遗武术的技术动作以数字化的形式保存和记录下来。