• 最近访问:
发表于 2025-10-19 07:51:00 东方财富Android版 发布于 湖南
在阿里云模型市场进行的为期超过三个月的 Beta 测试中,Aegaeon 系统展现了卓越的效能。测试数据显示,服务数十个参数量高达 720 亿的大模型,所需的英伟达 H20 GPU 数量从 1192 个成功减少至 213 个,数量削减高达 82%。
发表于 2025-10-19 07:39:22 发布于 湖南

$寒武纪-U(SH688256)$ 

南华早报今天(10 月 18 日)发布博文,报道称在韩国首尔举办的第 31 届操作系统原理研讨会(SOSP)上,阿里云发布的“Aegaeon”的计算池化解决方案研究成果成功入选,可解决 AI 模型服务中普遍存在的 GPU 资源浪费问题。

SOSP 是计算机操作系统领域的顶尖会议,相当于计算机操作系统界的“奥斯卡”,其录取率控制非常严格,平均每年收录的论文数量仅有数十篇,入选论文代表了操作系统和软件领域最具代表的研究成果。

博文称云服务商当前在提供 AI 模型服务时,面临着严重的资源效率低下问题。平台需要同时托管数千个 AI 模型以处理海量并发 API 调用,但用户请求往往高度集中在少数几个热门模型上,例如阿里巴巴的 Qwen 系列模型。研究人员发现,这种“长尾效应”导致了严重的资源闲置:在阿里云的模型市场中,竟有 17.7% 的 GPU 算力仅被用于处理 1.35% 的请求,造成了巨大的成本浪费。

  阿里云这一次地技术突破,对市场来说也算是一场不小的冲击,之前我们一直说,发展AI产业对于GPU芯片的需求量是持续增长的,但是阿里现在搞的新模型,GPU用量削减82%,这意味大模型公司的硬件采购成本降低,同时也意味着GPU厂商的产品增量逻辑被证伪,这对于国内的硬件厂商也算是利空。毕竟英伟达H20芯片被国内弃用,空出来的一大片市场应当能够让国产企业吃个饱,按现在的情况来说,感觉也不行了。虽说利空硬件企业,但对于大模型公司来说是利好,尤其是做AI模型的企业,GPU用量减少,能够真正达到降本增效的目的,助力AI大模型企业快速发展。

郑重声明:用户在财富号/股吧/博客等社区发表的所有信息(包括但不限于文字、视频、音频、数据及图表)仅代表个人观点,与本网站立场无关,不对您构成任何投资建议,据此操作风险自担。请勿相信代客理财、免费荐股和炒股培训等宣传内容,远离非法证券活动。请勿添加发言用户的手机号码、公众号、微博、微信及QQ等信息,谨防上当受骗!
作者:您目前是匿名发表   登录 | 5秒注册 作者:,欢迎留言 退出发表新主题
温馨提示: 1.根据《证券法》规定,禁止编造、传播虚假信息或者误导性信息,扰乱证券市场;2.用户在本社区发表的所有资料、言论等仅代表个人观点,与本网站立场无关,不对您构成任何投资建议。用户应基于自己的独立判断,自行决定证券投资并承担相应风险。《东方财富社区管理规定》

扫一扫下载APP

扫一扫下载APP
信息网络传播视听节目许可证:0908328号 经营证券期货业务许可证编号:913101046312860336 违法和不良信息举报:021-34289898 举报邮箱:jubao@eastmoney.com
沪ICP证:沪B2-20070217 网站备案号:沪ICP备05006054号-11 沪公网安备 31010402000120号 版权所有:东方财富网 意见与建议:021-54509966/952500