2月2日,阶跃星辰正式发布新一代开源Agent基座模型Step 3.5 Flash。该模型专为实时Agent工作流场景打造,实现了推理速度、智能水平与使用成本的兼顾,在单请求代码类任务中,其最高推理速度可达每秒350个token,为市场提供了“更快更强更稳”的Agent底层模型选择。
据悉,Step 3.5 Flash采用稀疏MoE架构设计,模型总计拥有1960亿参数,且每个token仅激活约110亿个参数,在保障模型核心能力的同时,实现了推理效率的显著提升,也为Agent类应用打造了更高效、更具性价比的底层模型方案。目前,华为昇腾、沐曦股份、壁仞科技、燧原科技、天数智芯、阿里平头哥等多家头部芯片厂商,已完成对该模型的适配工作。各方通过底层联合创新,进一步提升了模型适配性与算力效率,借助模型与算力的协同发展,有效降低了推理成本,大幅减少企业和开发者应用大模型的综合门槛,助力大模型在各类实际应用场景中加速落地。
业内人士认为,随着推理模型成为大模型发展主流,模型与算力的深度协同,将成为推动大模型规模化落地应用的重要路径。据悉,阶跃星辰已启动新一代模型Step 4的训练工作,后续将邀请开发者深度参与共建,携手共同定义下一代智能体基座模型。
阶跃星辰在大模型研发与应用落地领域的快速发展,离不开上海完善的人工智能产业生态与国资力量的强力支撑。今年以来,上海市人工智能企业轮番登陆资本市场,上海市政府主导的国家资本早已在该赛道提前布局,且上海国资敢于在企业发展关键阶段扮演领投方角色,以此吸引更多社会资本入局,形成合力共同支持硬科技企业发展。
目前,上海国资已在沪逐步构建起覆盖底层芯片算力、中间层模型工具、上层行业应用的完整AI生态版图。
过去五年,上海人工智能产业实现了从加速创新到规模化落地的跨越式发展,全市人工智能相关企业总数突破1万家,形成了完善的技术体系与应用生态。据上海市经信委发布的消息,上海市全年规上人工智能产业规模超5500亿元,增速保持在30%以上,为区域内人工智能企业的研发创新、生态共建与应用落地奠定了坚实的产业基础。