国内AI大模型厂商在AI编程领域的竞争近期呈现白热化趋势。7月23日,阿里开源全新的通义千问AI编程大模型Qwen3-Coder,通义千问官方在微信公号上表示“这是我们迄今为止最具代理能力的代码模型。”
据了解,Qwen3-Coder是千问系列模型中首个采用混合专家MoE架构的代码模型,总参数达480B,激活35B参数,原生支持256K token的上下文并可扩展至1M长度。Qwen3-Coder在代码占比70%的7.5T数据上预训练,在后训练阶段进行了编程任务及智能体任务的强化学习,最终实现了通用能力、代码能力及Agent能力的飞升:在浏览器调用(WebArena)、工具调用(BFCL)等Agent能力评测中,Qwen3-Coder刷新开源模型纪录,超越GPT4.1;在考察模型自主规划解决编程任务的SWE-Bench评测中,Qwen3-Coder取得了开源最佳效果,可媲美Claude4。这意味着其编程能力登顶全球开源模型阵营,并超越GPT4.1等闭源模型,比肩“全球最强”编程模型Claude4。
阿里方面表示,Qwen3-Coder在代码能力及Agent调用能力方面取得重大突破,擅长解决多步骤的长任务,它能通观全局自主安排工作内容,支持Agent调用各种工具深入钻研,最终解决复杂编程任务。基于Qwen3-Coder,网页开发、AI搜索、深度研究等智能体应用将变得更智能、更高效。实测数据显示,在执行任务时,Qwen3-Coder能够调用的工具数量比Claude多几倍,“借助Qwen3-Coder,刚入行的程序员一天就能完成资深程序员一周的工作,生成一个品牌官网最快只需5分钟。”
Qwen3-Coder已在魔搭社区、HuggingFace等平台开源,全球开发者都可以免费下载使用。Qwen3-Coder很快将接入阿里的AI编程产品通义灵码,API也已上线阿里云百炼。为方便开发者更好地使用Qwen3-Coder,通义团队还开源了一款命令行工具Qwen Code,可充分发挥Qwen3-Coder在代理式编程上的潜力。此外,Qwen3-Coder的API可以和Claude Code、Cline等工具协同使用。
贝壳财经记者注意到,2024年9月,阿里巴巴CEO吴泳铭曾在云栖大会上表示,“大模型技术快速迭代,技术可用性大幅提升。去年,大模型还只能帮助程序员写简单的代码,今天已经能直接理解需求,完成复杂的编程任务。”本次以阿里巴巴的名义发布Qwen3-Coder,足以证明阿里巴巴集团对这款产品的重视程度。