12月18日,火山引擎在FORCE原动力大会上正式发布豆包大模型1.8(Doubao-Seed-1.8)及音视频创作模型Seedance 1.5 pro。火山引擎总裁谭待表示,截至今年12月份,豆包大模型日均token使用量突破50万亿,较去年同期增长超过10倍;目前已有超过100家企业客户累计token使用量超过一万亿。
“目前大厂在多模态Agent(智能体)领域的竞争已从单点模型能力比拼,升级为‘模型—平台—生态’的系统化作战。”中国移动通信联合会教育与科学技术研究院执行院长陈晓华在接受《证券日报》记者采访时表示,火山引擎此次发布的产品旨在依托其日均调用量的规模优势,在Agent生态底座上确立领先地位。
技术突围
本次发布的豆包大模型1.8,其核心升级完全围绕“打造更强大的Agent大脑”展开。与单纯追求参数规模不同,该版本在设计之初便针对多模态Agent场景进行定向优化,在复杂指令遵循、多轮交互以及操作系统级别的实际操作(OS Agent)能力上实现了系统性增强。
在至关重要的多模态理解层面,豆包1.8完成了视觉能力的底层升级。其单次视频理解帧数提升至1280帧,并能以低帧率解析超长视频,在需要时调用工具对关键片段进行高精度分析。这一能力使得模型能够处理在线教育课程、工业质检视频等复杂冗长的视觉信息,为Agent在真实场景中自主决策提供了感知基础。
同步亮相的音视频创作模型Seedance 1.5 Pro,则从内容创作端展示了多模态融合的更高阶形态。该模型采用创新的原生音视频联合生成架构,实现了毫秒级的音画同步,并能基于画面景深和角色数量,精准匹配多人、多语言对话的口型。这解决了AI视频生成中长期存在的“张口无声”或口型错位的顽疾,将技术从“炫技”推向“实用”。
火山引擎推出上述两个模型,标志着大模型行业已从单纯的参数竞赛,全面进入了以多模态Agent为核心的产业落地新阶段。赛智产业研究院人工智能研究所副所长安赟对《证券日报》记者表示,这可以从三个维度来分析。其一,AI价值从“单点生成”向“全链路执行”的质变。通过多模态感知与Agent规划能力的结合,AI能够跨越感知与行动的鸿沟,真正具备了在垂直场景中闭环完成任务的能力。其二,IT基础设施从“功能驱动”向“智能驱动”的范式重构。火山引擎提出的“AI云原生架构”极具前瞻性,揭示了未来的软件形态将不再是传统的SaaS堆栈,而是以Agent为主体的智能协同网络。其三,大模型应用正在跨越“成本与稳定性”的规模化门槛。
竞争加剧
事实上,主要云厂商均已将战略重心调整至多模态智能体平台,竞争维度从单一模型能力升级为全栈技术、开发生态与行业场景的立体化角逐。
阿里云在9月份的云栖大会上全面升级了其全栈AI体系,实现从AI大模型到AI基础设施的技术更新。阿里通义旗舰模型Qwen3-Max不仅在多项评测中跻身全球前列,更在聚焦Agent工具调用能力的Tau2-Bench测试中取得突破性高分。更重要的是,阿里云发布了全新的Agent开发框架ModelStudio-ADK和低代码平台ModelStudio-ADP,将Agent的开发效率提升至“1个小时就能轻松开发一个能生成深度报告的Deep Research项目”的水平。
10月15日,百度搜索宣布全面升级文心助手AIGC创作能力,支持AI图片、AI视频、AI音乐、AI播客等8种模态创作。依靠百度搜索开放平台,文心助手支持一键调用多工具解决生活、健康、教育、工作等多场景问题。
在谭待看来,传统的IT架构已无法满足Agent时代的需求,以模型为中心的AI云原生架构正在形成,并围绕Agent的开发与运营进行重构。
面对竞争,火山引擎此次打出了“组合拳”。火山引擎全面升级了企业级AI Agent平台——AgentKit,覆盖了Agent从开发、部署到管控的全生命周期。同时,火山引擎推出了HiAgent智能体工作站,通过构建统一的企业AI任务调度中心、提供一系列开箱即用的通用智能体,以及支持个性化定制智能体应用,帮助企业实现Agent的规模化管理与应用。
除了提升模型能力外,火山引擎还推出业内首个“AI节省计划”,该计划通过阶梯定价,承诺最高可为按量付费的企业节省47%的成本。
“通过从模型能力到基础设施的全面革新,火山引擎正在推动AI应用从单一的模型调用向复杂的Agent智能体生态演进,加速AI在各行各业的深度落地。”谭待表示。