OpenAI 揭示了其 o3-mini 模型的更多思维过程

摘要:

为了应对包括中国人工智能公司 DeepSeek 在内的竞争对手的压力,OpenAI 正在改变其最新的人工智能模型o3-mini传达其逐步"思考"过程的方式。本周四,OpenAI 宣布,该公司的人工智能聊天机器人平台 ChatGPT 的免费和付费用户将看到更新的"思维链",其中显示了更多模型的"推理"步骤以及它是如何得出问题答案的。

据 OpenAI 称,在"高推理"配置中使用 o3-mini 的高级 ChatGPT 计划的用户也将看到这一更新的读数。

OpenAI 发言人通过电子邮件表示:"我们为 o3-mini 引入了更新的 [思维链],旨在让人们更容易理解模型是如何思考的。有了这个更新,你将能够遵循模型的推理,让你对它的反应更清晰、更有信心。"

像 o3-mini 这样的推理模型在给出结果之前会对自己进行彻底的事实检查,这有助于它们避免一些通常会让模型翻车的陷阱 。 代价是推理模型需要更长的时间才能得出解决方案,通常需要几秒到几分钟的时间。

DeepSeek的R1模型是一个类似于o3-mini的"推理"模型,它揭示了完整的思维过程,许多人工智能研究人员都认为这是首选的方法。 除了使模型更易于研究之外,推理步骤还能在某些情况下提供更好的用户体验,帮助指示模型何时可能处于正确或错误的轨道上。

部分由于竞争原因,OpenAI 选择不显示 o3-mini 及其前身 o1 和 o1-mini 的完整推理步骤。 相反,用户只能看到推理步骤的摘要--有时是错误的摘要。

GjInCrwWkAAyqUJ.jpg

不过,OpenAI仍然没有展示o3-mini的完整推理步骤,但该公司表示,它"找到了一个平衡点":o3-mini可以"自由思考",然后将其"想法"整理成更详细的摘要。

"为了提高清晰度和安全性,我们增加了一个额外的后处理步骤,在这个步骤中,模型会审查原始的思维链,删除任何不安全的内容,然后简化任何复杂的想法,"OpenAI 发言人继续说道。"此外,这一后处理步骤还能让非英语用户接收到母语版本的思维链,从而创造出更加易用和友好的体验。"

在上周的一次 Reddit AMA 中,OpenAI 的首席产品官凯文-韦尔暗示这一变化即将到来。

他说:"我们正在努力展示比今天更多的内容--[展示模型的思维过程]很快就会实现。全部待定--展示所有的思维链会导致竞争性的提炼,但我们也知道人们(至少是高级用户)想要它,所以我们会找到合适的方法来平衡它。"

我们在FebBox(https://www.febbox.com/cnbeta) 开通了新的频道,更好阅读体验,更及时更新提醒,欢迎前来阅览和打赏。
查看评论
created by ceallan