• 最近访问:
发表于 2025-03-01 23:09:30 股吧网页版
DeepSeek最新发声
来源:中国证券报

  3月1日,DeepSeek在知乎官方账号发布题为《DeepSeek-V3/R1推理系统概览》的文章。

  文章披露了DeepSeek-V3/R1推理系统采用大规模跨节点专家并行(EP)技术来实现更大的吞吐和更低的延迟。为提升整个系统效率和GPU利用率,DeepSeek尽可能地为每个GPU分配均衡的计算负载、通信负载。

  文章还披露了DeepSeek的成本、利润等关键信息。

  DeepSeek-V3和R1的所有服务均使用H800 GPU。由于服务负荷白天高、晚上低,DeepSeek实现一套机制,在白天负荷高的时候用所有节点部署推理服务,晚上负荷低的时候减少推理节点。

  2月27日至2月28日的24个小时内,DeepSeek-V3和R1推理服务占用节点总和,峰值占用为278个节点,平均占用226.75个节点(每个节点为8个H800 GPU)。假定GPU租赁成本为2美元/小时,总成本为87072美元/天。

  若所有tokens的输入和输出全部按照DeepSeek R1的定价计算,理论上DeepSeek一天的总收入为562027美元,成本利润率高达545%。不过,由于DeepSeek-V3定价低于R1,且网页端和应用程序免费,仅部分服务产生收入,再加上非高峰时段设有夜间折扣,其实际收入不及理论数值。

  2月26日,DeepSeek在官网宣布,北京时间每日00:30至08:30的夜间空闲时段,DeepSeek开放平台推出错峰优惠活动。在此期间,API调用价格大幅下调:DeepSeek-V3降至原价的50%,DeepSeek-R1更是低至25%。DeepSeek称,鼓励用户充分利用这一时段享受更经济更流畅的服务体验。

  “DeepSeek开源周”自2月24日启动,期间DeepSeek陆续开源了众多最新技术进展,包括FlashMLA、DeepEP、DeepGEMM和3FS四个开源项目以及DualPipe、EPLB等代码库。这些开源成果在业内引发了热烈讨论。

郑重声明:用户在财富号/股吧/博客等社区发表的所有信息(包括但不限于文字、视频、音频、数据及图表)仅代表个人观点,与本网站立场无关,不对您构成任何投资建议,据此操作风险自担。请勿相信代客理财、免费荐股和炒股培训等宣传内容,远离非法证券活动。请勿添加发言用户的手机号码、公众号、微博、微信及QQ等信息,谨防上当受骗!
作者:您目前是匿名发表   登录 | 5秒注册 作者:,欢迎留言 退出发表新主题
温馨提示: 1.根据《证券法》规定,禁止编造、传播虚假信息或者误导性信息,扰乱证券市场;2.用户在本社区发表的所有资料、言论等仅代表个人观点,与本网站立场无关,不对您构成任何投资建议。用户应基于自己的独立判断,自行决定证券投资并承担相应风险。《东方财富社区管理规定》

扫一扫下载APP

扫一扫下载APP
信息网络传播视听节目许可证:0908328号 经营证券期货业务许可证编号:913101046312860336 违法和不良信息举报:021-34289898 举报邮箱:jubao@eastmoney.com
沪ICP证:沪B2-20070217 网站备案号:沪ICP备05006054号-11 沪公网安备 31010402000120号 版权所有:东方财富网 意见与建议:021-54509966/952500