中国AI研究新突破阿里千问斩获顶级AI会议最佳论文奖_阿里巴巴-W(hk09988)股吧

股吧首页 > 阿里巴巴-W吧 > 正文

最近访问：

阿里巴巴-W吧

返回阿里巴巴-W吧>>

- 重要股东股权质押数据全览

阿里巴巴-W资讯

发表于 2025-11-28 12:30:39 股吧网页版

中国AI研究新突破阿里千问斩获顶级AI会议最佳论文奖

来源：上海证券报·中国证券网作者：杨翔菲温婷

　　上证报中国证券网讯（记者杨翔菲温婷）记者11月28日获悉，日前，人工智能领域顶级会议NeurIPS 2025公布了论文奖。阿里通义千问团队最新研究成果从全球2万多篇投稿论文中脱颖而出，被评为最佳论文，是唯一获得该奖项的中国团队。

　　该论文首次揭秘了注意力门控机制对大模型性能和训练的影响。业内人士普遍认为，该研究是突破当下大模型训练瓶颈的重要一步，将有力推动AI大模型技术的发展。

　　NeurIPS是人工智能领域影响力最大的顶会之一，该会议诞生了Transformer、AlexNet等里程碑式研究成果。今年，谷歌、微软、OpenAI、阿里巴巴及麻省理工学院等全球顶尖科技公司和机构共有2万多篇论文投稿，仅有约25%的论文被接收，而最佳论文仅有4篇，代表了目前全球人工智能领域最有价值和影响力研究。

　　门控机制被认为是模型的“智能阀门”，可以帮助模型过滤无效信息并提升模型性能。近年来，AlphaFold2、Forgetting Transformer等学术界和工业界模型开始尝试将门控和注意力机制结合，但业界尚未破解门控在注意力中发挥作用的内在原因，也缺少大规模实践的经验。

　　此次，通义千问研究团队通过在1.7B稠密模型（Dense）与15B混合专家模型（MoE）上进行了数十组实验，单组实验训练最多超过3.5万亿tokens，首次清晰揭秘了门控注意力背后的作用原理，并全面展示使用该方案的最佳方式。目前，该研究成果已应用于Qwen3-Next模型，并显著提升模型的性能与鲁棒性，相关技术方案、实验模型及产品级模型均已开源。NeurIPS评审委员会指出：“这项工作将被广泛应用，并极大推动AI研究人员对大语言模型中注意力机制的理解。”

　　通义千问团队表示：“对于门控注意力机制的深入理解，不仅为大语言模型架构设计提供了新思路，也为构建更稳定、更高效、更可控的大模型奠定了基础。”

（文章来源：上海证券报·中国证券网） [点击查看原文]

郑重声明：用户在财富号/股吧/博客等社区发表的所有信息（包括但不限于文字、视频、音频、数据及图表）仅代表个人观点，与本网站立场无关，不对您构成任何投资建议，据此操作风险自担。请勿相信代客理财、免费荐股和炒股培训等宣传内容，远离非法证券活动。请勿添加发言用户的手机号码、公众号、微博、微信及QQ等信息，谨防上当受骗！

评论该主题

帖子不见了！怎么办？

作者：您目前是匿名发表登录 | 5秒注册作者：，欢迎留言退出发表新主题

温馨提示： 1.根据《证券法》规定，禁止编造、传播虚假信息或者误导性信息，扰乱证券市场；2.用户在本社区发表的所有资料、言论等仅代表个人观点，与本网站立场无关，不对您构成任何投资建议。用户应基于自己的独立判断，自行决定证券投资并承担相应风险。《东方财富社区管理规定》