21世纪经济报道记者赵云帆 8月22日,A股算力板块再度成为“执牛耳者”。截至收盘,本轮行情的“股王”寒武纪以20%涨停报收,总市值来到惊人的5200亿人民币;晶圆龙头中芯国际A/H股分别上涨14.19%和10.06%,其中A股创下去年10月以来单日涨幅之最。光模块“双雄”新易盛、中际旭创续创新高,并分别上涨6.19%和5.16%;国产IDC龙头中科曙光亦以涨停报收,市值接近去年11月高点。
引爆日内算力行情的源点,来自两则消息。
8月21日晚间,杭州深度求索公司(DeepSeek)悄然于大模型资源网站HuggingFace上线 “DeepSeekV3.1” 版本。同时,该公司宣称其模型版本使用适配国产芯片结构的参数精度,暗示国产芯片未来有望得到大规模使用。
分析人士认为,在国际贸易保护主义背景下,国际芯片产业链供应链的不确定性犹存。DeepSeek-V3.1发布,以及腾讯业绩会透露GPU数量足够等信息,均利好AI算力国产化和本土AI芯片发展,国产算力板块再度迎来催化。
国产芯片+模型的“弯道超车”
8月21日晚间,深度求索在官方订阅号发布文章《DeepSeek-V3.1 发布,迈向 Agent 时代的第一步》,明确指出“DeepSeek-V3.1使用了UE8M0 FP8 Scale 的参数精度”。同时,在推文下置顶留言解释:“UE8M0 FP8是针对即将发布的下一代国产芯片设计”,引发DeepSeek新版本带来“国产AI芯片”量产的预期。
国产半导体的市场投机热情高涨。截至8月22日收盘,Wind半导体指数收涨7.31%,创下2022年4月以来新高。而日内半导体的热度泛化扩散,Wind科技大类指数日内上涨3.07%,续创历史新高。
值得注意的是,市场此前广泛期待深度求索公司释放推理模型更新版本“DeepSeek-R2”。然而此次发布的DeepSeek-V3.1主要焦点在于实现深度思考和快思考融合,迎合了此前OpenAI、Qwen等新释出模型产品结构的特征。因此部分分析人士甚至认为,DeepSeek“R系列”可能会融合在通用“V系列”版本中,不再独立迭代。
“思考与非思考模式的融合可以说是必然的趋势,也是大模型发展史上的一个小迭代,可以看到V3.1不是大版本,其更新值得期待,但不知道何时。 ”IDC中国研究总监卢言霞告诉记者。
而更令人关注的则是深度求索公司释出的信息,即“UE8M0 FP8 针对即将发布的下一代国产芯片设计”。
21世纪经济报道记者采访并综合各类观点发现,“UE8M0 FP8”目标或许是建立在国产算力芯片能力略逊于英伟达GPU,但能最大限度发挥国产芯片的理论算力和能效比,并在牺牲通用性的基础上,极大提升推理性能的一种参数精度模式。
而在此基础上,新的专用于国产芯片的国产模型,有望在定义明确的特定场景之中发挥更高效的推理能力,实现挑战甚至超越海外头部大模型在特定领域性能的可能。
“下一代国产芯片”引关注
对于此番DeepSeek发布新版大模型和使用新的计算精度,部分券商也发表了看法。
中信建投指出,DeepSeek模型更新至V3.1版,新增支持FP8精度和国产芯片,此举有望推动国产算力生态加速落地。腾讯不久前的业绩会上也透露,其推理芯片供应渠道多元化,在国际供应链波动下,国产推理算力芯片或成助力。华为昇腾芯片近期在政府、金融等行业的应用逐步扩大,进一步体现国产芯片的市场竞争力正在提升。
值得注意的是,21世纪经济报道记者从产业链人士处获悉,“UE8M0 FP8”是针对特定国产芯片的,因此很可能是针对某一种架构,或某家Fabless(无晶圆)芯片企业的。
不过,究竟是哪家,深度求索公司并未透露更多。
从国产芯片研发进度来说,去年年底,寒武纪推出了思元590芯片,应用ASIC架构,支持7nm工艺、512TOPS的算力,在推理场景能效比上已超越国际巨头,几乎支持所有国内主流大模型 。
据悉,思元590芯片已经被应用于字节跳动、百度、阿里云等企业的云端大模型训练,以及省级智算中心项目等。
DeepSeekV3.1的出现,成为了国产芯片在国内算力市场开始征程的“先兆”。但分析人士仍然指出,由于大模型适配国产芯片厂商的最终归属不清,加上研发进度,芯片良率等各种问题均可能存在,因此投资者也应提高风险意识,警惕市场过度炒作的风险。