4090显卡单枪匹马就能跑满血版DeepSeek-R1清华团队突破大模型算力难题_同方股份(600100)股吧

股吧首页 > 同方股份吧 > 正文

最近访问：

同方股份吧

返回同方股份吧>>

- 重要股东股权质押数据全览

n469513764420512

发表于 2025-02-16 06:27:38 股吧网页版发布于浙江

4090显卡单枪匹马就能跑满血版DeepSeek-R1清华团队突破大模型算力难题

4090显卡单枪匹马就能跑满血版DeepSeek-R1 清华团队突破大模型算力难题

2025-02-16 06:29:02 作者更新以下内容

清华大学KVCache.AI团队联合趋境科技发布的KTransformers开源项目迎来重大更新，成功打破大模型推理算力门槛。

2025-02-16 06:30:37 作者更新以下内容

此次KTransformers项目更新带来重大突破，支持在24G显存(4090D)的设备上本地运行 DeepSeek-R1、V3的671B满血版。其预处理速度最高可达286 tokens/s，推理生成速度最高能达到14 tokens/s。甚至有开发者借助这一优化技术，在3090显卡和200GB内存的配置下，使Q2_K_XL模型的推理速度达到9.1 tokens/s，实现了千亿级模型的 “家庭化” 运行。

郑重声明：用户在财富号/股吧/博客等社区发表的所有信息（包括但不限于文字、视频、音频、数据及图表）仅代表个人观点，与本网站立场无关，不对您构成任何投资建议，据此操作风险自担。请勿相信代客理财、免费荐股和炒股培训等宣传内容，远离非法证券活动。请勿添加发言用户的手机号码、公众号、微博、微信及QQ等信息，谨防上当受骗！

评论该主题

帖子不见了！怎么办？

作者：您目前是匿名发表登录 | 5秒注册作者：，欢迎留言退出发表新主题

温馨提示： 1.根据《证券法》规定，禁止编造、传播虚假信息或者误导性信息，扰乱证券市场；2.用户在本社区发表的所有资料、言论等仅代表个人观点，与本网站立场无关，不对您构成任何投资建议。用户应基于自己的独立判断，自行决定证券投资并承担相应风险。《东方财富社区管理规定》