• 最近访问:
发表于 2026-02-05 07:59:00 股吧网页版
中金:2026年大模型在强化学习、模型记忆、上下文工程等方面将取得更多突破
来源:人民财讯

  中金指出,回顾2025年,全球大模型技术能力向前演进,逐步攻克生产力场景,在推理、编程、Agentic以及多模态等能力方向取得明显进步,但模型通用能力在稳定性、幻觉率等方面仍存在短板。展望2026年,中金认为大模型在强化学习、模型记忆、上下文工程等方面将取得更多突破,从短context生成到长思维链任务,从文本交互到原生多模态,并向实现AGI长期目标更进一步。

  全文如下

  中金 | AI十年展望(二十六):2026关键趋势之模型技术篇

  中金研究

  回顾2025年,全球大模型技术能力向前演进,逐步攻克生产力场景,在推理、编程、Agentic以及多模态等能力方向取得明显进步,但模型通用能力在稳定性、幻觉率等方面仍存在短板。展望2026年,我们认为大模型在强化学习、模型记忆、上下文工程等方面将取得更多突破,从短context生成到长思维链任务,从文本交互到原生多模态,并向实现AGI长期目标更进一步。

  摘要

  我们预计2026年预训练Scaling-Law重现,旗舰模型参数量更上一个台阶。架构方面,基于Transformer的模型架构延续,平衡性能与效率的MoE成为共识,不同注意力机制路线仍在优化与切换。范式方面,预训练阶段Scaling-Law+高质量数据+强化学习将共同提高模型能力。2026年期待之一就是随着英伟达GB系列芯片成熟及推广,模型将基于更高性能的万卡集群在预训练阶段Scaling-Law,模型参数量和智能上限都将进一步提升。

  强化学习重要性提升,成为解锁模型高级能力的关键。强化学习的引入提高了模型的智能上限,让模型可以更有逻辑、更符合人类偏好进行思考和推理,其本质是“自我生成数据+多轮迭代”,强化学习的关键在于大规模算力+高质量数据。海外OpenAI、Gemini等模型厂商对于强化学习非常重视,国内DeepSeek、阿里千问等也在跟进,我们预计2026年海内外模型厂商强化学习占比将进一步提升。

  持续学习、模型记忆、世界模型等新路线将迎来核心突破。持续学习和模型记忆本质上是解决大模型“灾难性遗忘”问题,让模型具备选择性记忆机制。Google提出的Titans、MIRAS、Nested Learning等算法和架构核心是让模型可以根据任务的时间跨度和重要性动态调整学习和记忆的方式,从而实现持续学习甚至终身学习。此外,聚焦理解物理世界因果规律的世界模型在Genie 3和Marble等不同模型路径的探索下具备突破机遇。

  风险

  技术迭代不及预期;现有模型架构和训练范式被颠覆。

郑重声明:用户在财富号/股吧/博客等社区发表的所有信息(包括但不限于文字、视频、音频、数据及图表)仅代表个人观点,与本网站立场无关,不对您构成任何投资建议,据此操作风险自担。请勿相信代客理财、免费荐股和炒股培训等宣传内容,远离非法证券活动。请勿添加发言用户的手机号码、公众号、微博、微信及QQ等信息,谨防上当受骗!
作者:您目前是匿名发表   登录 | 5秒注册 作者:,欢迎留言 退出发表新主题
温馨提示: 1.根据《证券法》规定,禁止编造、传播虚假信息或者误导性信息,扰乱证券市场;2.用户在本社区发表的所有资料、言论等仅代表个人观点,与本网站立场无关,不对您构成任何投资建议。用户应基于自己的独立判断,自行决定证券投资并承担相应风险。《东方财富社区管理规定》

扫一扫下载APP

扫一扫下载APP
信息网络传播视听节目许可证:0908328号 经营证券期货业务许可证编号:913101046312860336 违法和不良信息举报:021-34289898 举报邮箱:jubao@eastmoney.com
沪ICP证:沪B2-20070217 网站备案号:沪ICP备05006054号-11 沪公网安备 31010402000120号 版权所有:东方财富网 意见与建议:021-54509966/952500