Google推出Gemini 3 Deep Think模式:面向Ultra订阅用户的深度推理升级

摘要:

Google在持续扩展 Gemini 3 模型家族的基础上,正式发布全新的 Gemini 3 Deep Think 模式,这一模式在 Gemini 3 Pro 之上投入了更多算力并引入新技术,旨在在复杂数学、科学与逻辑推理任务上提供更高水平的表现。

目前,Deep Think 已面向所有 Google AI Ultra 订阅用户开放,可在 Gemini 应用中通过在提示栏选择 Gemini 3 Pro 模型并切换至“Deep Think”模式直接使用。

据介绍,Gemini 3 Deep Think 在多项业内高难度基准测试中取得了“业界领先”的成绩。它在被视为当前最难 AI 推理测评之一的 Humanity’s Last Exam 上取得了 41% 的得分,在 ARC-AGI-2 测试中借助代码执行拿下 45.1% 的成绩,而在 GPQA Diamond 科学知识测试中则获得了 93.8% 的高分,均被标注为“最先进水平”。 Google表示,这一模式依托“高级并行推理”能力,可以同时探索多种假设路径,从而在复杂问题求解中大幅提升准确率和稳健性。

在实际竞赛场景中,Deep Think 相关模型也已展现出接近人类顶尖选手的实力。Google提到,这些 Deep Think 变体近期在国际数学奥林匹克(IMO)和国际大学生程序设计竞赛(ICPC)世界总决赛中达到了“金牌标准”水平。 在 IMO 测试设置中,模型需在两场各 4.5 小时的考试中,在完全离线、不可调用工具或互联网的条件下独立解题并撰写自然语言证明,对推理深度与表达能力要求极高。

对于终端用户而言,Gemini 3 Deep Think 的定位是作为 Ultra 订阅层中的“高推理模式”,主要面向需要严谨演绎、多步推理和高可靠性的复杂任务场景。Google强调,这一模式是在现有 Gemini 3 Pro 能力之上通过额外算力与新技术堆叠而成,因此更适合处理高难度数学、科学研究问题及复杂逻辑分析需求。 用户在 Gemini 应用内仅需在模型选项中切换到 Gemini 3 Pro 并启用 Deep Think,即可体验这一增强版推理能力。

文章还提到,OpenAI 早在今年 7 月就宣称其一款实验性推理大模型已达到“金牌级别”的表现,但该模型迄今尚未公开发布。 相比之下,Google此次将达到 IMO 金牌标准的 Deep Think 模型直接开放给 Ultra 订阅用户使用,被视为对竞品的一次“先手发布”,外界也普遍预计 OpenAI 可能在不久的将来跟进,将其高推理模型推向公众。

我们在FebBox(https://www.febbox.com/cnbeta) 开通了新的频道,更好阅读体验,更及时更新提醒,欢迎前来阅览和打赏。
查看评论
created by ceallan