5月28日,DeepSeek称,DeepSeek-R1模型已完成小版本试升级。“欢迎前往官方网页、App、小程序测试(打开深度思考),API接口和使用方式保持不变。”
不过,DeepSeek官方此次并没有公布版本更新的具体内容。业内人士称,DeepSeek升级后的模型,思维链 (CoT) 的行为似乎发生了显著变化。此前,业界纷纷推测,DeepSeek推出R2模型的具体时间。

新版DeepSeek-R1正式开源
DeepSeek是一家创新型科技公司,专注于开发先进的大语言模型(LLM)和相关技术。此前,DeepSeek在春节期间被称作“来自东方的神秘力量”,火爆全网。
目前,新版DeepSeek-R1已正式开源,DeepSeek-R1-0528模型权重已上传到开源社区HuggingFace。
关于本次迭代,有网友测试评论称,此次,DeepSeek-R1-0528更新核心亮点包括能像谷歌模型一样深度推理;文本生成优化:更自然,格式更佳;独特的推理风格:不仅快,而且更缜密;支持长时思考:单任务处理时长可达30分钟至60分钟。

此外,在编程方面,不少业内人士第一时间展开测评。
大模型热潮还在继续
日前,DeepSeek团队发布了新论文,以DeepSeek-V3为代表,深入解读DeepSeek在硬件架构和模型设计方面的关键创新,为实现具有成本效益的大规模训练和推理提供思路。其中,DeepSeek创始人兼CEO梁文锋是署名作者之一。DeepSeek在论文中提到,论文期望跨越硬件架构和模型设计,采用双重视角来探索其之间错综复杂的相互作用,以实现具有成本效益的大规模训练和推理。
3月25日晚,DeepSeek公司在官方账号上正式宣布V3模型完成小版本升级的消息,并介绍了新版本DeepSeek-V3-0324模型的提升细节,包括推理、前端开发、中文写作、中文搜索几个方面的能力优化。彼时,据海外专业AI模型评测机构最新排名,新版V3模型是得分最高的非推理模型。此后,DeepSeek热度开始下降。
不过,DeepSeek带来的大模型热潮还在继续。“AI技术快速迭代升级的背景下,中国人工智能产业正面临着算力市场的供需错配与生态发展不平衡的双重挑战。随着DeepSeek的问世,模型能力快速增强,行业体量快速变大,底层算力需求也越来越大。因此,对于大模型的开发、部署而言,提高算力资源的使用效率,将算力资源的价值最大程度发挥是未来行业发展的核心方向。”无问芯穹联合创始人兼CEO夏立雪说。
湘财证券指出,目前市场在等待DeepSeek-R2的发布,有望成为科技板块新一轮启动的契机。天风证券则在近期研报中持续看好AI行业作为年度投资主线,后续伴随着DeepSeek-R2/V4等以及包括Agent、多模态等方面相关进展,仍然看好AI行业以及围绕AIDC产业链的持续高景气。整体上,团队积极看好2025年,这或成为国内AI基础设施竞赛元年以及应用开花结果之年。
“不论DeepSeek-R2何时到来,我们始终坚信智能能力是当下人工智能产业发展的关键,并选择‘死磕’技术。”一位大模型企业相关负责人告诉记者。
作者:谭镕