• 最近访问:
发表于 2025-01-27 14:59:10 股吧网页版
国产大模型DeepSeek震惊世界:团队没有“海归”,训练成本不到GPT的二十分之一
来源:蓝鲸新闻

  蓝鲸新闻1月27日讯(记者郝妍)国产大模型DeepSeek超越ChatGPT,登顶苹果中国和美国应用商店免费APP下载排行榜,成为了全球科技圈的热议话题。

  DeepSeek登顶苹果美国区免费APP下载排行榜

  1月27日,苹果App Store中国区免费榜显示,DeepSeek站上首位。同时,DeepSeek在美区苹果App Store免费榜从昨日的第六位飙升至第一位,超越ChatGPT及Meta公司旗下的社交媒体平台Threads,以及Google Gemini、Microsoft Copilot等美国科技公司的生成式AI产品。

  DeepSeek爆火后曾出现两次宕机。

  1月26日,DeepSeek曾出现短时闪崩现象。对此,DeepSeek回应称,当天下午确实出现了局部服务波动,但问题在数分钟内就得到了解决。此次事件可能是由于新模型发布后,用户访问量激增,服务器一时无法满足大量用户的并发需求。

  今日又有消息称DeepSeek服务状态页面显示,DeepSeek网页/API不可用,目前正在调查该问题。

  和国内AI公司背靠互联网大厂不同,DeepSeek由量化对冲基金幻方量化运营。2016年,幻方量化推出首个AI模型,第一份由深度学习生成的交易仓位上线执行。到2017年底,几乎所有的量化策略都采用AI模型计算。2023年,幻方量化宣布成立创新性大模型公司DeepSeek。

  2024年12月,DeepSeek-V3首个版本上线,并同步开源,训练成本仅为557.6万美元,整个训练只需要280万个GPU小时。

  1月20日,DeepSeek又正式开源R1推理模型。1月24日,DeepSeek-R1在Chatbot Arena综合榜单上排名第三,与OpenAI的顶尖推理模型o1并列。

  从硅谷到华尔街,DeepSeek掀起涟漪

  DeepSeek的影响迅速蔓延至大洋彼岸的硅谷。据澎湃新闻援引Information网站报道,脸书母公司Meta成立了四个专门研究小组来研究量化巨头幻方量化旗下的国产大模型DeepSeek的工作原理,并基于此来改进旗下大模型Llama。

  DeepSeek之所以引发科技圈关注最主要的原因在于其以极小的成本训练出能和OpenAI的ChatGPT 一较高下的人工智能大模型。

  据每日经济新闻报道,DeepSeek的R1的预训练费用只有557.6万美元,仅是OpenAI GPT-4o模型训练成本的不到十分之一。同时,DeepSeek公布了API的定价,每百万输入tokens 1元(缓存命中)/4元(缓存未命中),每百万输出tokens 16元。这个收费大约是OpenAI o1运行成本的三十分之一。

  受此消息影响,华尔街也作出相应反应。

  据21世纪经济报道,美股大V“THE SHORT BEAR”在社交媒体上表示,DeepSeek创造了一个AI巨头们的痛苦时刻,而投资者必须对此敲响警钟。

  “如果击败OpenAI所需要的金额是5500万美元(包括5000个H800 GPU和500万预训练费用),那么这个行业的商业化会比很多人预想的要快很多。”

  1月25日,AMD宣布,已将新的DeepSeek-V3模型集成到Instinct MI300X GPU上,该模型旨在与SGLang一起实现最佳性能。DeepSeek-V3针对AI推理进行了优化。这对于在AI竞赛时代一直颇为风光的英伟达略显尴尬。

  据财联社报道,本周一,在亚洲盘交易时段,美国股指期货大跌,而这背后的主要原因,可能就是华尔街人士们担心DeepSeek的AI模型可能会颠覆美国科技界。

  与此同时,在日本东京股市,英伟达的主要供应商Advantest Corp.的股价一度暴跌了8.6%。

  本土阵容打造国产大模型黑马,实习生日薪最高上千元

  1月26日,《黑神话:悟空》制作人冯骥评价DeepSeek:可能是个国运级别的科技成果。

  而这一科技成果背后是一个完全本土化的阵容,据大象新闻报道,DeepSeek团队不到 140 人,但 “人才密度” 极高,成员多是来自清华、北大、北航等顶尖高校的应届博士毕业生、在读生以及硕士生。值得一提的是,团队没有“海归”,完全本土人才。

  “我们的核心技术岗位主要由今年或过去一两年毕业的人员担任”,DeepSeek创始人梁文锋在2023年接受媒体采访时表示。

  此前,DeepSeek开源大模型DeepSeek-V2的关键开发者之一罗福莉就曾被雷军以千万年薪招揽。

  DeepSeek爆火后,媒体也发现DeepSeek正在招聘。招聘网站显示,DeepSeek的北京子公司正在招人,现共放出了52个岗位,包括深度学习研究员、核心系统研发工程师以及资深ui设计师等,均为14薪。其中,薪资最高的为核心系统研发工程师(校招),薪资范围为6万元-9万元;除此之外,大部分岗位的起薪在2万元及以上。值得一提的是,该公司正在招聘实习生,AGI大模型实习生的工资为500元/天-1000元/天,数据百晓生实习生为500元/天-510元/天。

  从OpenAi横空出世,到DeepSeek以黑马之姿震惊世界,AI时代一日一变,一切皆有可能。

郑重声明:用户在财富号/股吧/博客等社区发表的所有信息(包括但不限于文字、视频、音频、数据及图表)仅代表个人观点,与本网站立场无关,不对您构成任何投资建议,据此操作风险自担。请勿相信代客理财、免费荐股和炒股培训等宣传内容,远离非法证券活动。请勿添加发言用户的手机号码、公众号、微博、微信及QQ等信息,谨防上当受骗!
作者:您目前是匿名发表   登录 | 5秒注册 作者:,欢迎留言 退出发表新主题
温馨提示: 1.根据《证券法》规定,禁止编造、传播虚假信息或者误导性信息,扰乱证券市场;2.用户在本社区发表的所有资料、言论等仅代表个人观点,与本网站立场无关,不对您构成任何投资建议。用户应基于自己的独立判断,自行决定证券投资并承担相应风险。《东方财富社区管理规定》

扫一扫下载APP

扫一扫下载APP
信息网络传播视听节目许可证:0908328号 经营证券期货业务许可证编号:913101046312860336 违法和不良信息举报:021-34289898 举报邮箱:jubao@eastmoney.com
沪ICP证:沪B2-20070217 网站备案号:沪ICP备05006054号-11 沪公网安备 31010402000120号 版权所有:东方财富网 意见与建议:021-54509966/952500