华为发布AI推理加速黑科技 算力大会将至 产业链获关注
来源:广州日报新花城
8月12日,在2025金融AI推理应用落地与发展论坛上,华为发布AI推理领域的突破性技术成果。作为一款推理加速套件,这款最新黑科技融合了多类型缓存加速算法工具,以分级管理推理过程中产生的相关记忆数据,扩大了推理上下文窗口,以实现高吞吐、低时延的推理体验,最终达到降低推理成本的目标。业界表示,这项成果的发布或能降低中国AI推理对HBM(高带宽内存)技术的依赖,提升国内AI大模型推理性能,完善中国AI推理生态的关键部分。

据了解,HBM是解决“数据搬运”的关键技术,当HBM不足时,用户使用AI推理的体验会明显下降,导致出现任务卡顿、响应慢等问题,影响AI推理效果。此前,华为数据存储产品线副总裁樊杰在接受媒体采访时表示,目前很多企业的算力集群使用效率低于30%,另外70%的时间是在等待数据归集和加载,而解决这一困境的破局之路不再是算力堆砌,而需要通过“以存强算”,提升算力集群的效率。因此,通过技术优化,华为推出高性能AI存储,能够将小时级数据加载缩短至分钟级,使算力集群效率从30%提升至60%,而在推理环节,通过长记忆存储能力,可避免重复运算,大幅降低推理成本。
记者关注到,2025中国算力大会将于8月22日至24日在山西大同举行,与算力相关的创新科技与最新进展也得到了业界的关注。第一上海证券认为,先进制程产能、先进封装产能、大模型适配、HBM供给等国产算力难题,随着时间推移均将被逐步攻克,产业链好消息预计将持续不断催化市场,看好2025年下半年乃至2026年国产算力的投资机会。长城证券认为,伴随国内外大模型的持续升级,AI推理能力要求更高,对算力的需求也在持续增加。
郑重声明:用户在财富号/股吧/博客等社区发表的所有信息(包括但不限于文字、视频、音频、数据及图表)仅代表个人观点,与本网站立场无关,不对您构成任何投资建议,据此操作风险自担。请勿相信代客理财、免费荐股和炒股培训等宣传内容,远离非法证券活动。请勿添加发言用户的手机号码、公众号、微博、微信及QQ等信息,谨防上当受骗!
评论该主题
帖子不见了!怎么办?作者:您目前是匿名发表 登录 | 5秒注册 作者:,欢迎留言 退出发表新主题
温馨提示: 1.根据《证券法》规定,禁止编造、传播虚假信息或者误导性信息,扰乱证券市场;2.用户在本社区发表的所有资料、言论等仅代表个人观点,与本网站立场无关,不对您构成任何投资建议。用户应基于自己的独立判断,自行决定证券投资并承担相应风险。《东方财富社区管理规定》