很彻底！预训练＋训练框架全放出，这一国产模型在 “小龙虾”上掀起热潮_财经评论(cjpl)股吧

股吧首页 > 财经评论吧 > 正文

最近访问：

财经评论吧

返回财经评论吧>>

- 重要股东股权质押数据全览

东方财富资讯君

发表于 2026-03-04 15:25:20 股吧网页版

很彻底！预训练＋训练框架全放出，这一国产模型在 “小龙虾”上掀起热潮

来源：上观新闻

　　今天（3月4日），中国大模型创业公司阶跃星辰继开源Step 3.5 Flash模型后，又开源了这款Agent基座模型的预训练权重（Base）、中训练权重（Midtrain）以及配套的Steptron训练框架。这一举动在当前大模型开源趋于保守的环境下，显得颇为彻底，在开源社区引发热烈反响。

　　据了解，Step 3.5 Flash采用稀疏MoE架构，每个token仅激活约110亿参数（总计1960亿），在单请求代码类任务上最高推理速度可达每秒350个token。在Agent场景和数学任务上，Step 3.5 Flash的能力逼近闭源模型，能够胜任复杂、长链条任务，是阶跃星辰迄今最强的开源基座模型。

　　在开发者社区和实际应用中，Step 3.5 Flash已经迅速获得了市场验证。截至目前，这款模型在Hugging Face上下载量已超30 万次。就在3月2日，Step 3.5 Flash单日调用量已超过40B，在OpenClaw（被中国网友称为“小龙虾”）的调用量榜中排名第二。

OpenClaw 调用量模型排名

　　值得一提的是，向来低调的阶跃星辰研发团队，罕见地现身相关社区回答全球开发者有关Step 3.5 Flash的提问。

　　有开发者提问：在规划Step 3.5 Flash时，你们是否心中已经瞄准了这个特定的“最佳平衡点”：89 tokens/参数，并且正好卡在消费级硬件规模的上限（128GB用于Q4量化，11B激活参数以保证实用的运行速度）？

　　阶跃星辰CTO朱亦博回复称，团队的确有明确目标，即让相关模型能够运行在128GB内存系统中。他发现，目前市场上约230B规模的模型，刚好超出了其个人MacBook Pro设备4位量化的承受范围，因此他便要求团队对模型规模进行了适当缩减。从开发者的角度去研发产品，而不是让开发者来适应产品。有开发者说，这正是他觉得兴奋的地方。

　　在与阶跃星辰研发团队的沟通中，有开发者希望阶跃星辰可以将基础模型与指令/思考模型一起发布，这样社区就可以对它进行微调了。

　　阶跃星辰对开发者有求必应——今天，阶跃星辰将Step 3.5 Flash的预训练权重、中训练权重以及配套的Steptron训练框架一同开源，希望通过更彻底的开源，让开发者能够以Step 3.5 Flash为基座进行更深度模型定制，打造真正属于自己的Agent。

　　新民晚报记者注意到，短时间内，海外社区对阶跃星辰进一步开源的反馈十分热烈。

　　业内专家分析，随着OpenClaw等Agent平台热度持续升温，Step 3.5 Flash的开源或将进一步加速中国模型在全球Agent生态中的渗透。

（文章来源：上观新闻） [点击查看原文]

郑重声明：用户在财富号/股吧/博客等社区发表的所有信息（包括但不限于文字、视频、音频、数据及图表）仅代表个人观点，与本网站立场无关，不对您构成任何投资建议，据此操作风险自担。请勿相信代客理财、免费荐股和炒股培训等宣传内容，远离非法证券活动。请勿添加发言用户的手机号码、公众号、微博、微信及QQ等信息，谨防上当受骗！

评论该主题

帖子不见了！怎么办？

作者：您目前是匿名发表登录 | 5秒注册作者：，欢迎留言退出发表新主题

温馨提示： 1.根据《证券法》规定，禁止编造、传播虚假信息或者误导性信息，扰乱证券市场；2.用户在本社区发表的所有资料、言论等仅代表个人观点，与本网站立场无关，不对您构成任何投资建议。用户应基于自己的独立判断，自行决定证券投资并承担相应风险。《东方财富社区管理规定》