Google发布改进型Gemini 1.5 系列AI模型 并将API价格降低50%
Google今天发布了两款可投入生产环境的更新版Gemini 1.5 型号:Gemini-1.5-Pro-002 和 Gemini-1.5-Flash-002。与五月份发布的原版 Gemini 1.5 型号相比,这两款新产品略有改进。
更新后的 Gemini 1.5 系列模型在 MMLU-Pro 基准成绩提高了约 7%,在 MATH 和 HiddenMath 基准中提高了约 20%,在视觉和代码用例中提高了约 2-7%。此外,Google还改进了模型响应的整体可用性。现在,两个模型的响应风格都更加简洁。据 Google 称,更新后模型的默认输出长度比以前的模型缩短了约 5-20%。
除了模型的改进,Google还将做出重大改变:他们正在降低Gemini 1.5 系列模型 API 的价格:输入词元降价 64%,产出词元降价 52%。
自 2024 年 10 月 1 日起,对Gemini 1.5 Pro 的增量缓存词元降价 64%,提示词元少于 128K 枚。
Google正在提高速率限制,允许开发人员构建复杂的人工智能应用。1.5 Flash 的付费级速率限制从原来的 1000 RPM 提高到 2000 RPM,1.5 Pro 从原来的 360 RPM 提高到 1000 RPM,。Google还降低了新机型的延迟,开发人员可以期待输出速度提高 2 倍,延迟降低 3 倍。
在更新后的Gemini 1.5(-002 型号)中,Google改进了该模型遵循用户指令的能力,同时兼顾了安全性。此外,默认情况下,Google不会对这些新模型应用人工智能内容安全过滤器。相反,开发人员可以根据自己的需求使用过滤器。
最后,Google发布了名为"Gemini-1.5-Flash-8B-Exp-0924"的改进版 Gemini 1.5 模型。这个改进的实验版本在文本和多模态用例方面都有显著的性能提升。开发人员现在可以通过 Google AI Studio 和 Gemini API 使用所有这些更新的 Gemini 1.5 模型。对于大型企业和Google云客户,这些新更新的 Gemini 1.5 模型可在 Vertex AI 上使用。
了解更多: