• 最近访问:
发表于 2025-05-29 13:13:20 股吧网页版
新版DeepSeek-R1,正式开源
来源:上海证券报

  5月28日,DeepSeek称,DeepSeek-R1模型已完成小版本试升级。“欢迎前往官方网页、App、小程序测试(打开深度思考),API接口和使用方式保持不变。”

  不过,DeepSeek官方此次并没有公布版本更新的具体内容。业内人士称,DeepSeek升级后的模型,思维链 (CoT) 的行为似乎发生了显著变化。此前,业界纷纷推测,DeepSeek推出R2模型的具体时间。

新版DeepSeek-R1正式开源

  DeepSeek是一家创新型科技公司,专注于开发先进的大语言模型(LLM)和相关技术。此前,DeepSeek在春节期间被称作“来自东方的神秘力量”,火爆全网。

  目前,新版DeepSeek-R1已正式开源,DeepSeek-R1-0528模型权重已上传到开源社区HuggingFace。

  关于本次迭代,有网友测试评论称,此次,DeepSeek-R1-0528更新核心亮点包括能像谷歌模型一样深度推理;文本生成优化:更自然,格式更佳;独特的推理风格:不仅快,而且更缜密;支持长时思考:单任务处理时长可达30分钟至60分钟。

  此外,在编程方面,不少业内人士第一时间展开测评。

大模型热潮还在继续

  日前,DeepSeek团队发布了新论文,以DeepSeek-V3为代表,深入解读DeepSeek在硬件架构和模型设计方面的关键创新,为实现具有成本效益的大规模训练和推理提供思路。其中,DeepSeek创始人兼CEO梁文锋是署名作者之一。DeepSeek在论文中提到,论文期望跨越硬件架构和模型设计,采用双重视角来探索其之间错综复杂的相互作用,以实现具有成本效益的大规模训练和推理。

  3月25日晚,DeepSeek公司在官方账号上正式宣布V3模型完成小版本升级的消息,并介绍了新版本DeepSeek-V3-0324模型的提升细节,包括推理、前端开发、中文写作、中文搜索几个方面的能力优化。彼时,据海外专业AI模型评测机构最新排名,新版V3模型是得分最高的非推理模型。此后,DeepSeek热度开始下降。

  不过,DeepSeek带来的大模型热潮还在继续。“AI技术快速迭代升级的背景下,中国人工智能产业正面临着算力市场的供需错配与生态发展不平衡的双重挑战。随着DeepSeek的问世,模型能力快速增强,行业体量快速变大,底层算力需求也越来越大。因此,对于大模型的开发、部署而言,提高算力资源的使用效率,将算力资源的价值最大程度发挥是未来行业发展的核心方向。”无问芯穹联合创始人兼CEO夏立雪说。

  湘财证券指出,目前市场在等待DeepSeek-R2的发布,有望成为科技板块新一轮启动的契机。天风证券则在近期研报中持续看好AI行业作为年度投资主线,后续伴随着DeepSeek-R2/V4等以及包括Agent、多模态等方面相关进展,仍然看好AI行业以及围绕AIDC产业链的持续高景气。整体上,团队积极看好2025年,这或成为国内AI基础设施竞赛元年以及应用开花结果之年。

  “不论DeepSeek-R2何时到来,我们始终坚信智能能力是当下人工智能产业发展的关键,并选择‘死磕’技术。”一位大模型企业相关负责人告诉记者。

  作者:谭镕

郑重声明:用户在财富号/股吧/博客等社区发表的所有信息(包括但不限于文字、视频、音频、数据及图表)仅代表个人观点,与本网站立场无关,不对您构成任何投资建议,据此操作风险自担。请勿相信代客理财、免费荐股和炒股培训等宣传内容,远离非法证券活动。请勿添加发言用户的手机号码、公众号、微博、微信及QQ等信息,谨防上当受骗!
作者:您目前是匿名发表   登录 | 5秒注册 作者:,欢迎留言 退出发表新主题
郑重声明:用户在社区发表的所有资料、言论等仅代表个人观点,与本网站立场无关,不对您构成任何投资建议。用户应基于自己的独立判断,自行决定证券投资并承担相应风险。《东方财富社区管理规定》

扫一扫下载APP

扫一扫下载APP
信息网络传播视听节目许可证:0908328号 经营证券期货业务许可证编号:913101046312860336 违法和不良信息举报:021-34289898 举报邮箱:jubao@eastmoney.com
沪ICP证:沪B2-20070217 网站备案号:沪ICP备05006054号-11 沪公网安备 31010402000120号 版权所有:东方财富网 意见与建议:021-54509966/952500