Google的最新Gemini模型在AI聊天机器人竞技场中夺回头名

摘要:

OpenAI 和Google之间的竞争日趋白热化。 这两家公司的大型语言模型正在轮流登上人工智能基准榜首。在较为权威的 Chatbot Arena 排行榜上,ChatGPT-4o (20241120) 于 11 月 21 日超越 11 月 15 日发布的 Gemini-EXP-1114 模型,成为排名第一的模型。 Google 今天宣布发布 Gemini-EXP-1206 实验机型,该机型在聊天机器人竞技场中再次反超了 ChatGPT-4o (20241120)。

图片.png

Gemini-Exp-1206 是总体表现排名第一的模型,在编码类别中与 OpenAI 的 o1 并列第一。 Gemini-EXP-1206 现在在以下类别中排名第一:

  • 整体风格控制

  • 硬提示

  • 带样式控制的硬提示

  • 编码

  • 数学

  • 创意写作

  • 指导跟踪

  • 长查询

  • 多轮对话

1733506872_chatbot_arena_gemini_1206.jpg

现在,Gemini-exp-1206 模型可在 Google AI Studio 和面向开发人员的 Gemini API 中使用。

与此相关的是,Meta 今天发布了 Llama 3.3 70B 开源模型,该模型可为基于文本的使用案例提供一流的性能。 Meta 声称,与其他同类闭源模型相比,Llama 3.3 70B 的推理成本非常低。

Meta 声称,Llama 3.3 的改进主要归功于新的配准过程和在线 RL 技术的进步。 值得注意的是,这个新的 70B 模型的性能与 Llama 3.1 405B 相似,但它甚至可以在普通开发人员工作站上本地运行。

GeIXhxyakAErybT.jpg

Hugging Face 提供了这款全新的 Llama 3.3 70B 模型。 不久,它将可通过 Azure 和其他领先的云平台进行部署。 有了像 Llama 3.3 这样功能强大、价格低廉的开源模型,人工智能开发的未来将充满希望,并向更广泛的开发者社区开放。

我们在FebBox(https://www.febbox.com/cnbeta) 开通了新的频道,更好阅读体验,更及时更新提醒,欢迎前来阅览和打赏。
查看评论
created by ceallan