DeepSeek新模型被夸疯了,有什么投资机会吗?
近日,DeepSeek发布最新开源模型OCR;3B规模、指数级效能变革、大道至简,被硅谷夸疯了。

DeepSeek新模型被硅谷热捧,核心在于用低成本+开源+技术突破”打破了行业惯性。
像DeepSeek-R1仅花600万美元、2000个英伟达芯片就实现比肩OpenAlo1的推理性能,成本远低于国外亿级投入;DeepSeek-0CR更用“视觉压缩文本”思路,3B参数模型就解决大模型处理长文本的算力难题,单GPU每天能生成20万页训练数据,压缩率10倍内准确率达97%,还被猜测开源了谷歌Gemini的核心技术。
这种“以小博大”的高效能路线,加上完全开源让全球开发者可复现(如伯克利、HuggingFace很快成功复现),与OpenAl等闭源巨头形成鲜明对比,自然引发硅谷惊叹。
这些模型将从三方面影响大模型发展:一是推动“低成本高效训练”成趋势,让中小团队也能参与核心研发,打破算力垄断;二是加速开源生态扩张,倒逼闭源厂商调整策略像Meta可能会更重视开源模型迭代;三是启发技术方向,比如“视觉-文本融合”“纯RL训练推理能力”等思路,为解决长上下文、推理效率等痛点提供新路径。
对我来说,将关注两类机会:一是直接布局深耕开源大模型的企业,尤其是有算法优化能力、能降低训练成本的团队;二是关注产业链配套,比如为高效训练提供硬件支持的GPU厂商、做模型压缩或推理优化的技术公司,不过要注意开源领域竞争激烈,需聚焦有核心技术壁垒和实际落地场景的标的。
我认为DS的高效性,GPU利用率的提高,只会让AI的应用更加广泛,整体行业出现广泛性应用的时刻也就临近了。
#DeepSeek、寒武纪同步发布引关注#
郑重声明:用户在基金吧/财富号/股吧等社区发表的所有信息(包括但不限于文字、视频、音频、数据及图表)仅代表个人观点,与本网站立场无关,不对您构成任何投资建议,据此操作风险自担。请勿相信代客理财、免费荐股和炒股培训等宣传内容,远离非法证券活动。请勿添加发言用户的手机号码、公众号、微博、微信及QQ等信息,谨防上当受骗!
评论该主题
帖子不见了!怎么办?作者:您目前是匿名发表 登录 | 5秒注册 作者:,欢迎留言 退出发表新主题
温馨提示: 1.根据《证券法》规定,禁止编造、传播虚假信息或者误导性信息,扰乱证券市场;2.用户在本社区发表的所有资料、言论等仅代表个人观点,与本网站立场无关,不对您构成任何投资建议。用户应基于自己的独立判断,自行决定证券投资并承担相应风险。《东方财富社区管理规定》