OpenAI 发布更新版 GPT-4o 模型夺回聊天机器人基准测试头名
今天,OpenAI 宣布了改进后的 GPT-4o 模型,并进行了一些显著的改进。 最新的 GPT-4o 模型改进了创意写作能力,可以提供更自然、更吸引人、更有针对性的写作,并具有更好的相关性和可读性。 OpenAI 还声称,这个新模型能更好地处理上传的文件,提供更深入的见解和更全面的回复。
全球的 ChatGPT 用户已经可以使用这种新模式。 对于开发人员来说,新的 GPT-4o 型号有以下名称:
GPT-4O-2024-11-20 (API)
chatgpt-4o-latest (API)
上述两个模型仍然具有 128000 个词元的上下文窗口、16384 个最大输出词元以及截至 2023 年 10 月的训练数据。
凭借这个新模型,OpenAI 还夺回了众包人工智能基准测试开放平台 Chatbot Arena 的第一名。 过去一周,ChatGPT-4o(20241120)作为"匿名聊天机器人"在聊天机器人竞技场进行了测试,并收集了约 8000+ 张社区选票。
根据排名,ChatGPT-4o (20241120) 超过了上周刚刚发布的Gemini-Exp-1114模型,得分1361。 根据社区评分,最新的 GPT-4o 在创意写作方面取得了显著的进步;其得分从 1365 分上升到了 1402 分。 总排名变化如下。
总成绩: #2 → #1
整体(StyleCtrl): #2 → #1
创意写作: #2 → #1
编码: #2 → #1
数学 #4 → #3
硬提示: #2 → #1
OpenAI 更新的 GPT-4o 模型标志着他们从之前的 o1 系列的转变,该系列侧重于逻辑推理。 GPT-4o 优先考虑创意写作,这表明 OpenAI 致力于探索人工智能模型的各种能力。 这与业界目前对数学和编码的关注相比,是一个令人耳目一新的变化。