• 最近访问:
发表于 2026-02-23 07:42:09 股吧网页版
国联民生:Token需求在“通胀” 短期观察大模型厂商提价与需求带来的边际改善
来源:国联民生

  1.云计算或是Tokens需求下一通胀方向

  2025Q4,AI产业链开启通胀传导,从存储到CPU后,云计算或为下一通胀方向。AI需求持续提升导致AI产业链自上而下出现不同环节依次涨价趋势,25H1开始存储率先开始涨价,26年1月CPU也开启涨价趋势,近期以AWS为代表的云计算厂商也开启涨价趋势。云计算厂商涨价或带来价值重估机遇,据维科网云计算观察微信公众号,AWS本次涨价标志着二十年来云服务价格只降不升的行业惯例被彻底打破,一旦云服务商在某一服务上成功提价而未引起大规模客户流失,第二次、第三次涨价就会变得更容易;AWS 发言人解释说:“EC2 机器学习容量块的定价基于供需模式而变化。此次价格调整反映了我们预期本季度的供需模式。”

图片

  云计算涨价有望带动系列配套产品涨价。据阿里云官网,一台云服务器ECS包括计算、存储、网络、快照服务等计费项及相关配套,都有望受益于云计算涨价趋势。

图片

  2.CPU:AI Agent大趋势下,具有长期发展前景

  AI算力快速发展趋势下,CPU作为基础设施,其需求与供给之间的矛盾或将延续,龙头在供给侧出现短缺。以CPU龙头英特尔为例,Intel 10和Intel 7的产能限制,限制了英特尔满足数据中心和客户端产品需求的能力。英特尔表示,由于需求持续超过供应,CPU短缺的情况可能会持续。针对 2026 年需求超过供应的前景,英特尔预计短缺将在2026年第一季度达到顶峰。英特尔不打算扩大这些节点的产能,这意味着随着需求的增长,产能限制仍将持续存在。

图片

  DeepSeek引领算力工程化优化,CPU重要性提升。MODEL1是DeepSeek FlashMLA中支持的两个主要模型架构之一,另一个是DeepSeek-V3.2。结合近期DeepSeek发表的相关论文,对算力的工程化优化可能成为DeepSeek模型演进的一个重点,CPU的重要性有望大幅提升。

  根据深科技官方公众号,在DeepSeek发表的论文《Conditional Memory via Scalable Lookup: A New Axis of Sparsity for Large Language Models》中,DeepSeek 在实验中成功演示了将一个高达1000亿参数的 Engram 嵌入表完全存储在廉价的主机内存(CPU DRAM)中,而非昂贵的GPU显存里。在模型计算前序层级时,系统通过 PCIe 通道异步地将所需的记忆数据搬运至GPU。实验数据显示,即使在 1000亿参数的超大规模下,这种跨硬件的存储与计算解耦方案带来的额外推理延迟也不到3%。这一工程结果表明,在特定的系统设计与实验条件下,模型参数规模不再严格受限于GPU显存容量。MoE的参数通常放在GPU显存(VRAM)里,因为计算需要极高的速度。但DeepSeek设计将这Engram的海量参数放在了性价比较高的CPU内存(RAM)里。

图片

  对于CPU的数量、效能长期需求提升:CPU调用主存里的Engram表做哈希检索、筛选有效数据、异步传给GPU,比原来多了检索+数据转发负载的工作。实验显示“存算分离”的设计让推理速度仅下降了2%,实现了千亿级别的知识容量扩展。根据英特尔的测试结果,在同一款至强® 6处理器平台上,如果使用AVX-512加速,在batch size等于50,token length等于14的FP16数据格式下,整个Engram的耗时需要10.046ms, 而使用AMX来加速Linear转换计算和Conv卷积计算,Engram的耗时只要6.022ms,整体性能提升至AVX-512的1.67倍。

图片

  AI Agent时代对CPU需求有望大幅增长。根据英特尔发布的《A CPU-Centric Perspective on Agentic AI》, Agentic AI框架在传统单体大语言模型(LLMs)基础上,增加了嵌入外部工具(包括网页搜索、Python 解释器、上下文数据库等)的决策协调器,将其从被动的文本应答工具转变为能够规划任务、调用工具、记忆历史步骤并动态适应的自主问题解决者。论文提出几个关键点:1)CPU上的工具处理会显著影响智能代理工作负载的执行延迟(占比最高达90.6%),这表明系统优化需要兼顾CPU与GPU,而非仅聚焦GPU。2)智能代理AI工作负载的吞吐量受限于两类因素:一类是CPU相关因素(核心超配、缓存一致性、同步机制),另一类是GPU相关因素(设备内存容量、带宽)。3)在大批量处理场景下,CPU动态能耗占比会变得显著(达44%),因为相较于GPU并行处理,CPU并行处理的能效更低。

  AI Agent时代CPU可能比GPU更早成为瓶颈:在进行Agent相关的强化学习的时候,需要海量的CPU来构建各种工具和environment,CPU决定的是每秒能并发生成、评估并稳定地“喂”给GPU。因此,CPU往往比GPU更早成为瓶颈,其效能直接影响GPU利用率、policylag、训练稳定性以及RL的整体收敛速度。

  3.数据库:云计算产业链景气度提升的又一重要受益方向

  Agent需求拉动沙盒数量增长,数据库PCU节点数量有望快速增长。据阿里云官网,数据库计算节点的收费公式为:(每小时内总PCU/3600)*PCU小时单价(1 PCU约等于1核2 GB内存的标准服务能力)。若Cowork类沙盒Agent需求大幅增长,将带动PCU数量快速增长,进而为数据库带来显著收入弹性。

图片

  全世界的Token量或将增长100倍或1000倍,AI原生数据库是未来大势所趋。阿里云资深副总裁、数据库产品事业部负责人李飞飞表示:“未来,AI原生数据库是技术演进的必然方向。从云原生到Al就绪,再到Al原生,PolarDB将持续深化AI与数据库的融合创新,加快走向超级人工智能时代。”截至2026年1月,阿里云PolarDB已获得海内外超2万用户的信赖,部署规模超300万核,覆盖全球86个可用区。阿里云PolarDB首次阐释了“AI就绪数据库”的四大核心支柱,包括多模态AI数据湖库、高效融合搜索能力、模型算子化服务以及面向Agent应用开发的后端服务。

  4.投资建议

  伴随Tokens需求快速提升,涨价趋势从上游逐步传导到CPU及云服务,全球云计算龙头AWS率先开启提价打破行业惯例,云计算及配套服务厂商有望迎来估值重构,建议关注:

  1)云计算:阿里巴巴、金山云、优刻得、首都在线、深信服、宏景科技、顺网科技、网宿科技、青云科技等;

  2)CPU:海光信息、中国长城、龙芯中科、禾盛新材等;

  3)数据库:星环科技、达梦数据、海量数据、太极股份、超图软件,拓尔思等。

郑重声明:用户在财富号/股吧/博客等社区发表的所有信息(包括但不限于文字、视频、音频、数据及图表)仅代表个人观点,与本网站立场无关,不对您构成任何投资建议,据此操作风险自担。请勿相信代客理财、免费荐股和炒股培训等宣传内容,远离非法证券活动。请勿添加发言用户的手机号码、公众号、微博、微信及QQ等信息,谨防上当受骗!
作者:您目前是匿名发表   登录 | 5秒注册 作者:,欢迎留言 退出发表新主题
温馨提示: 1.根据《证券法》规定,禁止编造、传播虚假信息或者误导性信息,扰乱证券市场;2.用户在本社区发表的所有资料、言论等仅代表个人观点,与本网站立场无关,不对您构成任何投资建议。用户应基于自己的独立判断,自行决定证券投资并承担相应风险。《东方财富社区管理规定》

扫一扫下载APP

扫一扫下载APP
信息网络传播视听节目许可证:0908328号 经营证券期货业务许可证编号:913101046312860336 违法和不良信息举报:021-34289898 举报邮箱:jubao@eastmoney.com
沪ICP证:沪B2-20070217 网站备案号:沪ICP备05006054号-11 沪公网安备 31010402000120号 版权所有:东方财富网 意见与建议:021-54509966/952500