• 最近访问:
发表于 2025-03-03 14:26:10 股吧网页版
财通证券:DeepSeek-V3/R1推理系统实现545%理论成本利润率
来源:财中社

  3月3日,财通证券发表研究报告称:

  DeepSeek开源周:更大的吞吐,更低的延迟,更极致的性价比。DeepSeek在2月24日至28日进行了为期5天的开源周“技术轰炸”,开源了5大代码库,覆盖训练、推理、通信、负载均衡以及数据加速的全链路,惊喜连连。开源周第1天发布FlashMLA,一款专为Hopper架构打造的高效MLA解码器,可高效处理变长序列,优化内存管理,榨取GPU极致性能。开源周第2天发布DeepEP,聚焦通信资源利用,提升数据高效传输,是首个为MoE量身定制的灵活GPU资源控制通信库。开源周的第三天,DeepSeek推出了支持稠密和MoE模型的FP8计算库——DeepGEMM,核心逻辑仅约300行代码直面AI计算中最频繁的矩阵乘法,可为V3/R1的训练和推理提供强大支持。开源周第4天,DeepSeek推出了一系列优化并行策略,包括DualPipe——一种用于V3/R1模型训练中实现计算与通信重叠的双向流水线并行算法;以及EPLB——一个针对V3/R1模型的专家并行负载均衡工具,并深入分析了V3/R1模型中的计算与通信重叠机制。开源周的最后一天,DeepSeek发布了3FS并行文件系统,旨在应对人工智能训练和推理工作负载带来的挑战。该系统利用现代固态硬盘(SSDs)和RDMA网络,提供一个共享存储层,从而简化分布式应用程序的开发,并加速DeepSeek平台上所有数据访问操作。

  OneMoreThing:DeepSeek-V3/R1推理系统实现大模型推理545%理论成本利润率。在开源周结束5天“技术轰炸”后,DeepSeek于第6天惊喜发布关于DeepSeek-V3/R1推理系统概述的文档,展示了如何通过跨节点并行、负载均衡和动态资源管理实现高吞吐量、低延迟和高性价比的推理服务,以实现545%理论成本利润率。DeepSeek提出了三种负载均衡器:PrefillLoadBalancer、DecodeLoadBalancer和Expert-ParallelLoadBalancer。它们分别针对不同的核心问题进行优化,目标是为每个GPU分配均衡的计算和通信负载,从而提高整体系统效率。

  DeepSeek开源六连击,尽显极客风采:DeepSeek开源周上接连不断的技术发布,彰显了团队的极客精神和开源理念。正如其官方所言:“这里没有象牙塔,只有秉持纯粹的车库创业精神和社区驱动的创新理念。”此次FlashMLA项目中同样包含了一行内联代码,这表明DeepSeek团队深入至高级编程语言CUDA和GPU的底层机器代码之间,对GPU的并行计算、内存访问等进行更加细致的控制,进一步提升程序的性能。这不仅体现了团队对算法的深耕,也展现了他们对效率的极致工程化追求。

郑重声明:用户在财富号/股吧/博客等社区发表的所有信息(包括但不限于文字、视频、音频、数据及图表)仅代表个人观点,与本网站立场无关,不对您构成任何投资建议,据此操作风险自担。请勿相信代客理财、免费荐股和炒股培训等宣传内容,远离非法证券活动。请勿添加发言用户的手机号码、公众号、微博、微信及QQ等信息,谨防上当受骗!
作者:您目前是匿名发表   登录 | 5秒注册 作者:,欢迎留言 退出发表新主题
温馨提示: 1.根据《证券法》规定,禁止编造、传播虚假信息或者误导性信息,扰乱证券市场;2.用户在本社区发表的所有资料、言论等仅代表个人观点,与本网站立场无关,不对您构成任何投资建议。用户应基于自己的独立判断,自行决定证券投资并承担相应风险。《东方财富社区管理规定》

扫一扫下载APP

扫一扫下载APP
信息网络传播视听节目许可证:0908328号 经营证券期货业务许可证编号:913101046312860336 违法和不良信息举报:021-34289898 举报邮箱:jubao@eastmoney.com
沪ICP证:沪B2-20070217 网站备案号:沪ICP备05006054号-11 沪公网安备 31010402000120号 版权所有:东方财富网 意见与建议:021-54509966/952500