• 最近访问:
发表于 2026-03-04 15:25:20 股吧网页版
很彻底!预训练+训练框架全放出,这一国产模型在 “小龙虾”上掀起热潮
来源:上观新闻

  今天(3月4日),中国大模型创业公司阶跃星辰继开源Step 3.5 Flash模型后,又开源了这款Agent基座模型的预训练权重(Base)、中训练权重(Midtrain)以及配套的Steptron训练框架。这一举动在当前大模型开源趋于保守的环境下,显得颇为彻底,在开源社区引发热烈反响。

  据了解,Step 3.5 Flash采用稀疏MoE架构,每个token仅激活约110亿参数(总计1960亿),在单请求代码类任务上最高推理速度可达每秒350个token。在Agent场景和数学任务上,Step 3.5 Flash的能力逼近闭源模型,能够胜任复杂、长链条任务,是阶跃星辰迄今最强的开源基座模型。

  在开发者社区和实际应用中,Step 3.5 Flash已经迅速获得了市场验证。截至目前,这款模型在Hugging Face上下载量已超30 万次。就在3月2日,Step 3.5 Flash单日调用量已超过40B,在OpenClaw(被中国网友称为“小龙虾”)的调用量榜中排名第二。

OpenClaw 调用量模型排名

  值得一提的是,向来低调的阶跃星辰研发团队,罕见地现身相关社区回答全球开发者有关Step 3.5 Flash的提问。

  有开发者提问:在规划Step 3.5 Flash时,你们是否心中已经瞄准了这个特定的“最佳平衡点”:89 tokens/参数,并且正好卡在消费级硬件规模的上限(128GB用于Q4量化,11B激活参数以保证实用的运行速度)?

  阶跃星辰CTO朱亦博回复称,团队的确有明确目标,即让相关模型能够运行在128GB内存系统中。他发现,目前市场上约230B规模的模型,刚好超出了其个人MacBook Pro设备4位量化的承受范围,因此他便要求团队对模型规模进行了适当缩减。从开发者的角度去研发产品,而不是让开发者来适应产品。有开发者说,这正是他觉得兴奋的地方。

  在与阶跃星辰研发团队的沟通中,有开发者希望阶跃星辰可以将基础模型与指令/思考模型一起发布,这样社区就可以对它进行微调了。

  阶跃星辰对开发者有求必应——今天,阶跃星辰将Step 3.5 Flash的预训练权重、中训练权重以及配套的Steptron训练框架一同开源,希望通过更彻底的开源,让开发者能够以Step 3.5 Flash为基座进行更深度模型定制,打造真正属于自己的Agent。

  新民晚报记者注意到,短时间内,海外社区对阶跃星辰进一步开源的反馈十分热烈。

  业内专家分析,随着OpenClaw等Agent平台热度持续升温,Step 3.5 Flash的开源或将进一步加速中国模型在全球Agent生态中的渗透。

郑重声明:用户在财富号/股吧/博客等社区发表的所有信息(包括但不限于文字、视频、音频、数据及图表)仅代表个人观点,与本网站立场无关,不对您构成任何投资建议,据此操作风险自担。请勿相信代客理财、免费荐股和炒股培训等宣传内容,远离非法证券活动。请勿添加发言用户的手机号码、公众号、微博、微信及QQ等信息,谨防上当受骗!
作者:您目前是匿名发表   登录 | 5秒注册 作者:,欢迎留言 退出发表新主题
温馨提示: 1.根据《证券法》规定,禁止编造、传播虚假信息或者误导性信息,扰乱证券市场;2.用户在本社区发表的所有资料、言论等仅代表个人观点,与本网站立场无关,不对您构成任何投资建议。用户应基于自己的独立判断,自行决定证券投资并承担相应风险。《东方财富社区管理规定》

扫一扫下载APP

扫一扫下载APP
信息网络传播视听节目许可证:0908328号 经营证券期货业务许可证编号:913101046312860336 违法和不良信息举报:021-34289898 举报邮箱:jubao@eastmoney.com
沪ICP证:沪B2-20070217 网站备案号:沪ICP备05006054号-11 沪公网安备 31010402000120号 版权所有:东方财富网 意见与建议:021-54509966/952500