OpenAI 揭示了其 o3-mini 模型的更多思维过程

0 cnBeta.COM 2025-02-07 15:38:32

摘要：

为了应对包括中国人工智能公司 DeepSeek 在内的竞争对手的压力，OpenAI 正在改变其最新的人工智能模型o3-mini传达其逐步"思考"过程的方式。本周四，OpenAI 宣布，该公司的人工智能聊天机器人平台 ChatGPT 的免费和付费用户将看到更新的"思维链"，其中显示了更多模型的"推理"步骤以及它是如何得出问题答案的。

据 OpenAI 称，在"高推理"配置中使用 o3-mini 的高级 ChatGPT 计划的用户也将看到这一更新的读数。

OpenAI 发言人通过电子邮件表示："我们为 o3-mini 引入了更新的 [思维链]，旨在让人们更容易理解模型是如何思考的。有了这个更新，你将能够遵循模型的推理，让你对它的反应更清晰、更有信心。"

像 o3-mini 这样的推理模型在给出结果之前会对自己进行彻底的事实检查，这有助于它们避免一些通常会让模型翻车的陷阱。代价是推理模型需要更长的时间才能得出解决方案，通常需要几秒到几分钟的时间。

DeepSeek的R1模型是一个类似于o3-mini的"推理"模型，它揭示了完整的思维过程，许多人工智能研究人员都认为这是首选的方法。除了使模型更易于研究之外，推理步骤还能在某些情况下提供更好的用户体验，帮助指示模型何时可能处于正确或错误的轨道上。

部分由于竞争原因，OpenAI 选择不显示 o3-mini 及其前身 o1 和 o1-mini 的完整推理步骤。相反，用户只能看到推理步骤的摘要--有时是错误的摘要。

不过，OpenAI仍然没有展示o3-mini的完整推理步骤，但该公司表示，它"找到了一个平衡点"：o3-mini可以"自由思考"，然后将其"想法"整理成更详细的摘要。

"为了提高清晰度和安全性，我们增加了一个额外的后处理步骤，在这个步骤中，模型会审查原始的思维链，删除任何不安全的内容，然后简化任何复杂的想法，"OpenAI 发言人继续说道。"此外，这一后处理步骤还能让非英语用户接收到母语版本的思维链，从而创造出更加易用和友好的体验。"

在上周的一次 Reddit AMA 中，OpenAI 的首席产品官凯文-韦尔暗示这一变化即将到来。

他说："我们正在努力展示比今天更多的内容--[展示模型的思维过程]很快就会实现。全部待定--展示所有的思维链会导致竞争性的提炼，但我们也知道人们（至少是高级用户）想要它，所以我们会找到合适的方法来平衡它。"

查看评论

今日最热

加载中...

最新资讯

今日最热