9月24日,在2025云栖大会现场,阿里云智能首席技术官周靖人发布了多项重磅技术更新。当日,通义大模型七连发,在模型智能水平、Agent工具调用和Coding能力、深度推理、多模态等方面实现多项突破。

上证报记者孙小程摄
在大语言模型中,阿里通义旗舰模型Qwen3-Max全新亮相。作为通义千问家族中最大、最强的基础模型,Qwen3-Max预训练数据量达36T tokens,总参数超过万亿,拥有极强的Coding编程能力和Agent工具调用能力。

下一代基础模型架构Qwen3-Next及系列模型正式发布,性能即可媲美千问3旗舰版235B模型,实现模型计算效率的重大突破。在专项模型方面,千问编程模型Qwen3-Coder重磅升级。在多模态模型中,视觉理解模型Qwen3-VL重磅开源,在视觉感知和多模态推理方面实现重大突破。全模态模型Qwen3-Omni惊喜亮相,音视频能力狂揽32项开源最佳性能SOTA,可像人类一样听说写,应用场景广泛,未来可部署于车载、智能眼镜和手机等。
此外,通义大模型家族中的视觉基础模型通义万相,推出Wan2.5-preview系列模型,涵盖文生视频、图生视频、文生图和图像编辑四大模型。通义万相2.5还全面升级图像生成能力,可生成中英文文字和图表,支持图像编辑功能,输入一句话即可完成P图。
通义大模型家族还迎来全新成员——语音大模型通义百聆,包括语音识别大模型Fun-ASR、语音合成大模型Fun-CosyVoice。Fun-ASR基于数千万小时真实语音数据训练而成,具备强大的上下文理解能力与行业适应性;Fun-CosyVoice可提供上百种预制音色,可以用于客服、销售、直播电商、消费电子、有声书、儿童娱乐等场景。
截至目前,阿里通义开源300余个模型,覆盖不同大小的“全尺寸”及LLM、编程、图像、语音、视频等“全模态”,全球下载量突破6亿次,全球衍生模型17万个,稳居全球第一。