阿里千问最新推理模型亮相，多项性能破纪录_阿里巴巴-W(hk09988)股吧

股吧首页 > 阿里巴巴-W吧 > 正文

最近访问：

阿里巴巴-W吧

返回阿里巴巴-W吧>>

- 重要股东股权质押数据全览

阿里巴巴-W资讯

发表于 2026-01-27 10:32:10 股吧网页版

阿里千问最新推理模型亮相，多项性能破纪录

来源：新京报作者：罗亦丹

　　新京报贝壳财经讯1月26日晚间，阿里正式发布千问旗舰推理模型Qwen3-Max-Thinking，在多项关键性能基准测试中，千问表现超过了GPT-5.2、Claude Opus 4.5 和Gemini 3 Pro等顶尖模型，刷新全球纪录，进一步拓展了人工智能系统的推理性能边界。

　　通过总参数、强化学习、推理计算的极致规模扩展，千问新模型实现了性能的大幅飞跃，刷新科学知识（GPQA Diamond）、数学推理（IMO-AnswerBench）、代码编程（LiveCodeBench）等多项关键性能基准测试的全球纪录。

　　具体来看，在关键的模型推理能力提升中，千问新模型采用了一种全新的测试时扩展（Test-time Scaling）机制，推理性能提升的同时还更经济。业界普遍的推理时计算，只会简单增加并行推理路径，重复推导已知结论，造成冗余推理效率低下；而千问采用的这一新机制，可对此前推理的结果进行“经验提取”式的提炼，并据此进行多轮自我迭代，在相同的上下文中实现更高效的推理计算，获得更智能的推理结果。基于这一推理技术创新，千问推理性能和推理效率大为提升，比如在启用工具的“人类最后的测试”HLE中，千问得分58.3，大幅超过GPT-5.2-Thinking的45.5、Gemini 3 Pro的45.8，录得当前所有模型的最高分。

　　阿里方面表示，Qwen3-Max-Thinking总参数超万亿，进行了更大规模的强化学习后训练，并通过推理技术的系列创新，最终完成模型性能的大幅飞跃。其还大幅增强了自主调用工具的原生Agent能力，模型可像专业人士一样边用工具边思考。同时，模型幻觉也大为降低，为解决真实复杂任务打下基础。目前，普通用户可通过千问PC端和网页端试用新模型，千问APP也即将接入，所有用户都可免费体验。

（文章来源：新京报） [点击查看原文]

郑重声明：用户在财富号/股吧/博客等社区发表的所有信息（包括但不限于文字、视频、音频、数据及图表）仅代表个人观点，与本网站立场无关，不对您构成任何投资建议，据此操作风险自担。请勿相信代客理财、免费荐股和炒股培训等宣传内容，远离非法证券活动。请勿添加发言用户的手机号码、公众号、微博、微信及QQ等信息，谨防上当受骗！

评论该主题

帖子不见了！怎么办？

作者：您目前是匿名发表登录 | 5秒注册作者：，欢迎留言退出发表新主题

温馨提示： 1.根据《证券法》规定，禁止编造、传播虚假信息或者误导性信息，扰乱证券市场；2.用户在本社区发表的所有资料、言论等仅代表个人观点，与本网站立场无关，不对您构成任何投资建议。用户应基于自己的独立判断，自行决定证券投资并承担相应风险。《东方财富社区管理规定》