阿里云Aegaeon 系统应运而生,破局算力浪费(利空算力硬件)
南华早报今天(10 月 18 日)发布博文,报道称在韩国首尔举办的第 31 届操作系统原理研讨会(SOSP)上,阿里云发布的“Aegaeon”的计算池化解决方案研究成果成功入选,可解决 AI 模型服务中普遍存在的 GPU 资源浪费问题。
SOSP 是计算机操作系统领域的顶尖会议,相当于计算机操作系统界的“奥斯卡”,其录取率控制非常严格,平均每年收录的论文数量仅有数十篇,入选论文代表了操作系统和软件领域最具代表的研究成果。
博文称云服务商当前在提供 AI 模型服务时,面临着严重的资源效率低下问题。平台需要同时托管数千个 AI 模型以处理海量并发 API 调用,但用户请求往往高度集中在少数几个热门模型上,例如阿里巴巴的 Qwen 系列模型。研究人员发现,这种“长尾效应”导致了严重的资源闲置:在阿里云的模型市场中,竟有 17.7% 的 GPU 算力仅被用于处理 1.35% 的请求,造成了巨大的成本浪费。
阿里云这一次地技术突破,对市场来说也算是一场不小的冲击,之前我们一直说,发展AI产业对于GPU芯片的需求量是持续增长的,但是阿里现在搞的新模型,GPU用量削减82%,这意味大模型公司的硬件采购成本降低,同时也意味着GPU厂商的产品增量逻辑被证伪,这对于国内的硬件厂商也算是利空。毕竟英伟达H20芯片被国内弃用,空出来的一大片市场应当能够让国产企业吃个饱,按现在的情况来说,感觉也不行了。虽说利空硬件企业,但对于大模型公司来说是利好,尤其是做AI模型的企业,GPU用量减少,能够真正达到降本增效的目的,助力AI大模型企业快速发展。
相关股吧:
寒武纪-U(688256)
郑重声明:用户在财富号/股吧/博客等社区发表的所有信息(包括但不限于文字、视频、音频、数据及图表)仅代表个人观点,与本网站立场无关,不对您构成任何投资建议,据此操作风险自担。请勿相信代客理财、免费荐股和炒股培训等宣传内容,远离非法证券活动。请勿添加发言用户的手机号码、公众号、微博、微信及QQ等信息,谨防上当受骗!
评论该主题
帖子不见了!怎么办?作者:您目前是匿名发表 登录 | 5秒注册 作者:,欢迎留言 退出发表新主题
温馨提示: 1.根据《证券法》规定,禁止编造、传播虚假信息或者误导性信息,扰乱证券市场;2.用户在本社区发表的所有资料、言论等仅代表个人观点,与本网站立场无关,不对您构成任何投资建议。用户应基于自己的独立判断,自行决定证券投资并承担相应风险。《东方财富社区管理规定》