DeepSeek表示,华为已成功用昇腾芯片适配V3,至此,中国芯配中国大模型,两者实现完美耦合,且可相互促进相互修正加速迭代。DeepSeek不仅支持昇腾平台,还与AMD的Instinct MI300X GPU进行了紧密合作。
晟腾和AMD使得英伟达不再是唯一,这可能才是英伟达遭受抛售的原因所在。
1月27日,DeepSeek在美区下载超越ChatGPT,成为榜首。因美区下载量过大,DeepSeek曾出现短暂服务波动,但问题在数分钟内得到解决。
DeepSeek V3多项评测成绩超越了Qwen2.5-72B和Llama-3.1-405B等其他开源模型,并在性能上和世界顶尖的闭源模型GPT-4o(OpenAI大模型)以及Claude-3.5-Sonnet不分伯仲。
但最令AI圈惊叹的是,DeepSeek V3在性能上与顶尖的闭源大模型GPT-4o(OpenAI大模型)比肩的同时,全部训练成本总计仅为557.6万美元,仅为GPT-4o训练成本的二十分之一。

加州大学伯克利分校计算机系教授Alex Dimakis表示,AI界都对DeepSeek的性能感到有些震惊,他们采用了不同的技术路径,并且大大方方地进行了技术开源。

北京时间1月28日午夜消息,就在北京时间今日凌晨1点,DeepSeek 宣布开源全新的视觉多模态模型 Janus-Pro-7B。

Meta创始人兼CEO马克扎克伯格在一档播客节目中表示,DeepSeek的大模型非常先进。Meta已经成立了四个专门研究小组来研究DeepSeek的工作原理,并基于此来改进旗下大模型Llama。
游戏科学创始人、CEO,《黑神话:悟空》制作人冯骥评价DeepSeek:可能是个国运级别的科技成果!

ChatGPT回应被DeepSeek超越:
"DeepSeek如果能够在短时间内超越ChatGPT,可能是在某些方面有独特的优势或者满足了用户的某种需求,比如更高效的搜索、深度信息挖掘或者更符合用户习惯的界面和功能。""
ChatGPT同时表示,"在AI领域我们已经积累了很强的品牌效应和用户基础,这样的排名变化也许是暂时的,但也说明了市场上竞争激烈,AI应用的创新空间还很大。如果 DeepSeek真能带来一些突破性体验,可能会在长期内对市场格局产生影响。"
微软CEO谈及DeepSeek,"它的计算效率极高!"

连线:"DeepSeek使用阉割的芯片,竟然能达到比它贵20倍成本的美国同行的水平,如DeepSeek使用同等芯片甚至使用比美国暂时还落后的华为芯片,DeepSeek将超越美国至少5倍!""
美国市场担心的,不单是被中国AI超越,他们更由此产生的质疑是:美国巨头花重金囤积GPU的意义何在?英伟达3.5万亿美元市值真的值吗?美国政府处心积虑管制先进AI芯片对华出口的作用又何在?是不是在催生另一个DeepSeek或者在助力华为?
AI的埃佛勒斯峰(中国称之为珠穆朗玛峰)被中国登顶后,西方只剩下芯片领域暂时领先了,但是如果芯片不再被AI那么的需要,难道只剩下在玩游戏时用来渲染和光追吗?
谷歌母公司总裁:“我们曾认为在人工智能领域至少领先中国两年,但现在看来,美国并没有在人工智能的赛跑中保持领先,也无法通过芯片来遏制对手,甚至目前显示的结果,是我们还可能比对手略逊一筹。”
Scale AI首席执行官Alexander Wang:中国已凭借DeepSeek开源模型迅速赶超美国。他表示,过去十年来,美国可能一直在人工智能领域领先于中国,但在最近几天,一切都发生了变化。
DeepSeek若计划在2-3年内实现**全栈国产化**,与华为合作是必然选择,分阶段实施会如下:
1. 短期(2024年):在推理场景部署昇腾芯片,积累迁移经验。已达成。
2. 中期(2025年):联合开发训练优化工具链,降低生态切换成本。
3. 长期(2026年后):基于华为先进制程芯片设计专用模型架构。
国产化AI大模型deepseek:
华为昇腾芯片 替代英伟达芯片
华为CANN 替代英伟达CUDA
华为Mindspore 替代Pytorch
- 2月1日,华为官宣,DeepSeek R1 已经成功适配并部署在华为升腾(Ascend)NPU平台上,具体使用的是升腾910B3芯片。*deepseek国产替代*
