谷歌最近给它的“AI 超强版”用户送上了一份大礼——在 Gemini 应用里正式上线了 Gemini 3 深度思考模式(Deep Think),而且是同时支持移动端和网页端。这个功能从11月18日发布以来就备受关注,当时谷歌说还在做额外的安全评估,要等几周才推出来,现在终于兑现承诺了。我特别关注这个功能,因为它不是简单的小升级,而是针对复杂问题设计的“慢思考”模式,有点像让AI开启深度脑力模式,专门用来啃那些硬骨头问题。
上线节奏与用户覆盖
Deep Think 模式目前已面向 Google AI Ultra 订阅用户逐步开放,也就是我们常说的“AI 超强版”用户。它作为 Gemini 3 的一个增强推理变体,主打的就是“用更长的推理时间换取更高质量的回答”。虽然目前还在逐步放量阶段,部分用户可能还没看到入口,但只要你是 Ultra 用户,并且更新到了最新版本的 Gemini 应用,基本很快就能用上。这个功能不会对免费用户开放,体现了谷歌将高端能力锁定在订阅生态中的策略。
性能突破与实测表现
最让我眼前一亮的是它的基准测试成绩,真的可以说是“小幅迭代,大幅跃迁”:
- 在 Humanity’s Last Exam(人类终极考试)这类高阶通用推理任务中,标准版 Gemini 3 得分是 37.5%,而 Deep Think 提升到了 41.0%;
- 在研究生级别的科学问答 GPQA Diamond 上,更是从 91.9% 升至 93.8%;
- 更关键的是,在 ARC-AGI-2 这种需要抽象推理加代码执行的任务上,Deep Think 拿下了 45.1% 的得分,展现了强大的系统性思维能力。
这些数据说明,它不只是算得久一点,而是在多步推理、工具调用和跨模态理解上有质的提升,非常适合科研推导、复杂决策这类场景。
使用方式与典型场景
怎么用呢?很简单:登录你的 Ultra 账号,在 Gemini 应用的对话界面选择 Deep Think 模式,然后提问就行。不过要注意,它响应会比标准版慢不少,毕竟正在“深度思考”。我觉得最适合它的几个场景包括:
- 做数学证明或理论推导时,需要形式化拆解的问题;
- 写代码遇到性能瓶颈,想让它帮忙做跨文件重构或测试生成;
- 分析长视频或多张图表,尤其是结合论文内容做要点抽取和论证;
- 制定长期策略或任务规划,比如资源受限下的最优路径设计。
一句话总结:如果你的问题没法一句话说清楚,那就该交给 Deep Think。当然,日常快问快答还是推荐用标准版,效率更高。