本报讯 (记者梁傲男)7月25日,阿里巴巴集团控股有限公司(以下简称“阿里”)全新开源千问3推理模型,性能大幅提升,一举夺下“全球最强开源模型”王座,比肩顶级闭源模型Gemini-2.5pro、o4-mini。本周,阿里已连续开源3款重磅模型,分别斩获基础模型、编程模型、推理模型等主流领域的三项全球开源冠军。两天前开源的AI编程模型Qwen3-Coder,更是引爆全球AI圈,掀起一波用中国千问开源模型替代闭源模型的新浪潮。
最新推出的千问3推理模型,登顶全球最强开源推理模型。自千问3旗舰模型Qwen3-235B-A22B发布后,阿里通义团队一直在扩展大模型的推理极限,全新开源的千问3推理模型在通用能力和深度思考能力上实现巨大飞跃。千问3推理模型支持256K上下文长度,在知识(SuperGPQA)、编程(LiveCodeBenchv6)、数学(AIME25)、人类偏好对齐(Arena-Hardv2)、创意写作(WritingBench)、多语言能力(MultilF)等核心能力上,千问3推理模型完全可比肩Gemini-2.5pro、o4-mini等顶尖闭源模型,并创下全球开源模型的最佳性能表现。
3天前开源的Qwen3-235B-A22B-Instruct-2507(非思考版)新模型,性能显著提升,在GPQA(知识)、AIME25(数学)、LiveCodeBench(编程)、Arena-Hard(人类偏好对齐)、BFCL(Agent能力)等众多测评中表现出色,超越Claude4(Non-thinking)等领先闭源模型。权威AI研究机构ArtificialAnalysis指出,“千问3是全球最智能的非思考基础模型”。
在AI编程领域,新开源的Qwen3-Coder被誉为“全球最好的编程模型”。Qwen3-Coder在代码能力及Agent调用能力方面取得重大突破。在多语言SWE-bench、Mind2Web、Aider-Polyglot等模型Agent能力评估中,Qwen3-Coder超越GPT4.1、Claude4等顶级闭源模型,并登顶全球最大AI开源社区HuggingFace模型总榜冠军。借助Qwen3-Coder,刚入行的程序员一天就能完成资深程序员一周的工作,生成一个品牌官网最快只需5分钟。
Qwen3-Coder的开源,引爆硅谷科技圈,在全球AI圈掀起一波“AI编程”热潮。海外知名模型API聚合平台OpenRouter数据显示,阿里千问API调用量暴涨,过去几天已突破1000亿Tokens,在OpenRouter趋势榜上包揽全球前三,是当下最热门的模型。
截至目前,阿里已开源300余款通义大模型,通义千问衍生模型突破14万个,超越Meta的Llama系列成为全球第一的开源模型家族,通义也是开发者和企业使用最广泛的大模型。未来三年,阿里巴巴还将投入超过3800亿元用于建设云和AI硬件基础设施,持续升级全栈AI能力,为中国和全球开发者和企业提供更先进的模型和云计算服务。