DeepSeek R2没等来 R1“小升级”发布：思考时间更长效果如何？_财经评论(cjpl)股吧

股吧首页 > 财经评论吧 > 正文

最近访问：

财经评论吧

返回财经评论吧>>

- 重要股东股权质押数据全览

东方财富资讯君

发表于 2025-05-29 15:19:40 股吧网页版

DeepSeek R2没等来 R1“小升级”发布：思考时间更长效果如何？

来源：澎湃新闻

　　DeepSeek低调升级，引发科技圈热议。

　　5月28日，DeepSeek 在官方微信群发布消息称，DeepSeek R1模型已完成“小版本试升级”，欢迎前往官方网页、APP、小程序测试（打开深度思考），API 接口和使用方式保持不变。

　　不过，澎湃新闻记者查询官方网站等，发现没有对此次更新的详细信息。记者咨询了一位DeepSeek内部人士，对方回复称是“小升级”。

　　根据Hugging Face，DeepSeek-R1此次开源版本为0528。

　　从宣传来看，此次升级十分低调，不过，根据网友测评，此次升级可不是简单的“小升级”。

　　有科技媒体分析称，时隔4个月，DeepSeek-R1完成了超进化，编码能力强到离谱，而且思考时间更长了。据称，新模型基于DeepSeek-V3-0324训练（参数为660B）。在LiveCodeBench基准上，DeepSeek-R1-0528性能几乎与o3-mini（High）和o4-mini（Medium)实力相当，一举超越了Gemini 2.5 Flash。

　　科技类网站“AIGC开放社区”的评论称，在著名代码测试平台Live CodeBench中显示，其性能可以媲美OpenAI最新的o3模型高版本。也有网友对新版R1的风格进行了测试，几乎和OpenAI的o3差不多。

　　从社交媒体的反馈来看，网友最为关注的是此次DeepSeek R1更新后的思考时间变长。据测评显示，此次DeepSeek单任务处理时长可达30-60分钟。

　　此外，有网友通过实验对比了Claude-4-Sonnet与DeepSeek-R1-0528的实际表现。可以看到，DeepSeek-R1生成的代码在模拟物理碰撞方面表现更好。

　　值得注意的是，此前有传言称，深度求索可能将在5月推出下一代AI大模型DeepSeek-R2。

　　有报道称，DeepSeek-R2大模型将会采用一种更先进的混合专家模型(MoE)，其结合更加智能的门控网络层(Gating Network)以优化高负载推理任务的性能。

　　不过，当时有内部人士向记者坦言，该传言真实度不高。从目前的情况分析，DeepSeek或许将用此次R1版本的升级，取代R2版本的推出。

　　尽管网友评测得出的结论十分惊喜，但是也有业内人士向记者表示，建议理性客观看待，也期待更为权威的测评结果。

　　在DeepSeek R1发布更新后，远在大洋彼岸的AI巨头英伟达（Nasdaq：NVDA）发布截至4月27日的2026财年第一财季财报，期内实现营收440.62亿美元，同比上涨69%，高于市场预期的432.8亿美元；美国通用会计准则（GAAP）下净利润187.75亿美元，同比上涨26%。在财报电话会上，英伟达CEO黄仁勋再次谈到DeepSeek所引发的市场对于推理模型的关注，以及推理模型会需要更大的算力支持，这将驱动推理算力需求。

（文章来源：澎湃新闻） [点击查看原文]

郑重声明：用户在财富号/股吧/博客等社区发表的所有信息（包括但不限于文字、视频、音频、数据及图表）仅代表个人观点，与本网站立场无关，不对您构成任何投资建议，据此操作风险自担。请勿相信代客理财、免费荐股和炒股培训等宣传内容，远离非法证券活动。请勿添加发言用户的手机号码、公众号、微博、微信及QQ等信息，谨防上当受骗！

评论该主题

帖子不见了！怎么办？

作者：您目前是匿名发表登录 | 5秒注册作者：，欢迎留言退出发表新主题

郑重声明：用户在社区发表的所有资料、言论等仅代表个人观点，与本网站立场无关，不对您构成任何投资建议。用户应基于自己的独立判断，自行决定证券投资并承担相应风险。《东方财富社区管理规定》