字节跳动在AI方面又有大动作。
6月11日,字节跳动旗下火山引擎举办Force原动力大会。会上,字节跳动发布豆包大模型1.6、视频生成模型Seedance 1.0 pro等重磅新模型。
字节跳动CEO梁汝波通过视频发言表示,AI发展还处于早期,只是马拉松的前500米。在AI大模型带来的技术变革时代,字节跳动致力于成为优秀的创新科技公司。
豆包大模型1.6发布
打造三大模型矩阵
会上,火山引擎总裁谭待宣布,火山引擎正式发布豆包大模型1.6系列,进一步优化模型能力和服务成本。
据介绍,豆包1.6系列当前由三个模型组成,其中,doubao-seed-1.6是全功能综合模型,支持256K长上下文、自适应思考(自动判断是否开启深度推理);doubao-seed-1.6-thinking强化深度推理,编码、数学、逻辑能力显著提升,支持复杂Agent构建;doubao-seed-1.6-flash是极速版本,适用于实时交互场景(如智能客服、语音助手)。
据介绍,豆包1.6系列模型支持多模态理解和图形界面操作,能够理解和处理真实世界问题。相比豆包1.5的多模态能力,图形界面操作能力让其进一步具备“行动力”,如自动操作浏览器完成酒店预定,识别购物小票并整理成Excel表格等任务。
多项权威测评成绩显示,在复杂推理、竞赛级数学、多轮对话和指令遵循等测试集上,豆包1.6-thinking的表现已跻身全球前列。
除了多模态能力以外,大模型另一个振奋人心的领域是视频生成。会上,火山引擎发布最新的豆包视频生成模型seedance 1.0 pro,支持无缝多镜头叙事、丝滑运镜,应用于电商广告、影视分镜、游戏剧情生成。
“根据第三方权威榜单,豆包视频生成模型在文生视频、图生视频两个维度都超越了业界诸多主流模型。”谭待称。
豆包大模型成本降至1/3
推动Agent规模化应用提速
在AI Agent快速发展的当下,规模化落地面临多重挑战,模型价格成为最大瓶颈。
谭待说,深度思考、多模态和工具调用等模型能力提升,是构建Agent的关键要素。同时,由于Agent每次执行任务都会消耗大量tokens。只有模型使用成本降下来,才能推动Agent的规模化应用。
据介绍,通过技术和商业创新,豆包1.6创新“区间定价”,深度思考、多模态能力与基础语言模型统一价格。在企业使用量最大的0~32K输入区间,豆包1.6的输入价格为0.8元/百万tokens、输出8元/百万tokens,综合成本只有豆包1.5深度思考模型或DeepSeek-R1的三分之一。
Seedance 1.0 pro模型每千tokens仅0.015元,每生成一条5秒的1080P视频只需3.67元,为行业最低。
字节跳动技术副总裁洪定坤认为,随着模型能力的持续进步,AI有机会成为调度者,通过调用不同的 Agent和工具,让软件开发“all in one”,更大幅度地降低开发门槛,提升开发效率。
谭待认为,技术主体经历了三个时代变化,AI时代会推动开发范式与技术架构全面升级。他说:“PC时代主体是Web,移动时代是App,AI时代则是Agent。Agent能够自主感知、规划和反思,完成复杂任务。”
字节跳动CEO梁汝波:
AI发展还在马拉松的前500米
豆包大模型市场迄今表现出色,行业应用深度渗透。
据了解,豆包大模型日均tokens调用量从2024年12月的4万亿飙升至2025年5月的16.4万亿,年增长率超300%,稳居中国公有云大模型服务调用量第一,占据46.4%的市场份额。
同时,企业级应用场景快速扩展,AI搜索、编程、视觉理解等场景tokens消耗5个月增长4.4倍,其中,K12在线教育增长12倍,智能巡检、视频检索等新场景突破日均百亿tokens。
字节跳动CEO梁汝波通过视频发言表示,AI发展还在很早期,只是马拉松的前500米。在AI大模型带来的技术变革时代,字节跳动也要对自己提出更高的要求,做一个优秀的科技公司还不够,得做优秀的创新科技公司,“前者是能够利用先进技术的公司,而后者能够探索和发明新技术,这是挑战非常大、有非常高天花板和想象力的事情”。