阿里开源千问3，参数量为DeepSeek-R1三分之一_阿里巴巴(usbaba)股吧

股吧首页 > 阿里巴巴吧 > 正文

最近访问：

阿里巴巴吧

返回阿里巴巴吧>>

- 重要股东股权质押数据全览

阿里巴巴资讯

发表于 2025-04-29 09:28:40 股吧网页版

阿里开源千问3，参数量为DeepSeek-R1三分之一

来源：界面新闻

　　4月29日凌晨，阿里巴巴开源新一代通义千问模型Qwen3(千问3)，参数量为DeepSeek-R1的三分之一，成本大幅下降。据称，该模型性能全面超越R1、OpenAI-o1等领先模型，登顶全球最强开源模型。

　　千问3是国内首个“混合推理模型”，将“快思考”与“慢思考”集成进同一个模型，对简单需求可低算力“秒回”答案，对复杂问题可多步骤“深度思考”，节省算力消耗。

　　阿里巴巴表示，千问3系列支持119种语言，并基于近36万亿个token(标记)进行训练，使用的数据量是千问2.5的两倍。

　　千问3系列包括两个专家混合(MoE)模型和另外六个模型。阿里巴巴开源了两个MoE模型的权重：拥有2350多亿总参数和220多亿激活参数的Qwen3-235B-A22B，以及拥有约300亿总参数和30亿激活参数的小型MoE 模型Qwen3-30B-A3B。

　　阿里巴巴表示，Qwen3-235B-A22B在代码、数学、通用能力等基准测试中，可媲美DeepSeek-R1、o1、o3-mini、Grok-3和Gemini-2.5-Pro等顶级模型。

　　此外，六个Dense模型也已开源，包括Qwen3-32B、Qwen3-14B、Qwen3-8B、Qwen3-4B、Qwen3-1.7B和Qwen3-0.6B，均在Apache 2.0许可下开源。

　　阿里巴巴表示，千问3代表了该公司在通往通用人工智能(AGI)和超级人工智能(ASI)旅程中的一个重要里程碑。未来，阿里计划从多个维度提升模型，包括优化模型架构和训练方法，以实现扩展数据规模、增加模型大小、延长上下文长度、拓宽模态范围等关键指标。

　　阿里巴巴集团CEO吴泳铭在今年2月的业绩会上表示，阿里集团在AI战略里面的首要目标是AGI(通用人工智能)的实现，可能远远超过现在可见的任何一个应用场景。

　　阿里巴巴预判如果实现AGI，人工智能相关产业大概率将会是全球最大的产业，有可能影响或者替代现在50%左右的GDP构成。

　　目前，包括谷歌在内的多家科技巨头推出了开源模型。今年3月，谷歌开源多模态大模型Gemma 3正式发布。这款仅需单块H100 GPU即可运行的27B参数模型，不仅性能对标谷歌闭源大模型Gemini 1.5 Pro，更以“低成本、高性能”的标签重新定义了行业标准。这一举措被业界视为谷歌在开源AI领域的一次重大战略升级。

　　今年3月底，OpenAI 宣布计划在今年发布自GPT-2以来的首个“开源”语言模型。据媒体报道，OpenAI的开源模型将采用“输入文本，输出文本”的模式，并可能允许开发者自由开启或关闭其“推理”功能。

（文章来源：界面新闻） [点击查看原文]

郑重声明：用户在财富号/股吧/博客等社区发表的所有信息（包括但不限于文字、视频、音频、数据及图表）仅代表个人观点，与本网站立场无关，不对您构成任何投资建议，据此操作风险自担。请勿相信代客理财、免费荐股和炒股培训等宣传内容，远离非法证券活动。请勿添加发言用户的手机号码、公众号、微博、微信及QQ等信息，谨防上当受骗！

评论该主题

帖子不见了！怎么办？

作者：您目前是匿名发表登录 | 5秒注册作者：，欢迎留言退出发表新主题

郑重声明：用户在社区发表的所有资料、言论等仅代表个人观点，与本网站立场无关，不对您构成任何投资建议。用户应基于自己的独立判断，自行决定证券投资并承担相应风险。《东方财富社区管理规定》