上证报中国证券网讯(记者刘暄)百度集团副总裁、深度学习技术及应用国家工程研究中心副主任吴甜日前在2025年世界科技与发展论坛开幕式上作主题演讲,分享了深度学习技术如何赋能AI+产业数智化转型。吴甜表示,深度学习是人工智能关键核心技术,在过去一段时间驱动AI实现了飞跃式进步,为大模型的爆发提供了基础。深度学习平台一方面支持大模型的研发,另外一方面和大模型协同优化,支撑产业智能化转型。
吴甜介绍,深度学习平台下接芯片,上承大模型和应用,AI的开发、训练、推理部署以及产业落地,都离不开深度学习平台的支撑。以百度飞桨为例,作为百度自研的产业级深度学习开源开放平台,飞桨从核心框架、基础模型库,到端到端开发套件、工具与组件,以及星河社区等,支持文心大模型的演进过程。目前,飞桨已适配 60多款系列芯片,创建超过110万个模型。
“文心大模型的能力拓展和效率提升,得益于飞桨和文心的联合优化,包括框架模型的联合优化,也包括框架算力的联合优化。”吴甜进一步表示,通过训练和推理的技术创新,ERNIE-4.5-300B-A47B模型上实现预训练MFU达47%,ERNIE-4.5-300B-A47B模型在TPOT 50ms时延条件下,实现了输入57K tokens/秒、输出29K tokens/秒的高吞吐性能。
公开资料显示,2018年底,百度开展了大模型技术研发,2019年3月正式发布文心大模型1.0,今年4月发布了多模态大模型文心4.5 Turbo和深度思考模型文心X1 Turbo,9月X1 Turbo升级为文心X1.1。
如何让大模型在产业应用中发挥更大的作用,让千行百业获得更大的受益,吴甜认为能够提供一系列丰富的产业级开发套件和工具的深度学习平台至关重要。百度基于文心与飞桨打造的人工智能基础技术底座,正在助力千行百业提效降本、增强企业经营、决策等能力。
现场,吴甜还分享了基于文心大模型的实践——数字人。她表示,百度自研的多模协同的数字人技术包含剧本驱动的数字人多模协同、融合多模规划与深度思考的剧本生成、动态决策的实时交互、文本自控的语音合成、高一致性超拟真数字人长视频生成五项创新技术,实现了数字人“神、形、音、容、话”的高度统一。最终呈现出一个具备高表现力,内容吸引人,人-物-场可自由交互的超拟真数字人。
据悉,目前,百度已经助力打造超过10万数字人主播,直播转化率提升31%,开播成本下降80%。公开资料显示,在百度慧播星的应用实践中,数字人直播的线上表现超过了真人。此前,罗永浩数字人直播首秀GMV突破行业新纪录,部分核心品类带货量超过真人直播。
“技术持续革新不断驱动应用创新,应用创新进而转化为实际商业价值,最终推动产业向更高级形态转型升级。目前飞桨文心开发者数量已超过2333万,服务超过76万家企业。”吴甜说。