Google 将 Gemini 2.5 设计为一系列混合推理模型,旨在提供卓越的性能,同时兼顾成本和速度的帕累托前沿。今天,2.5 Pro 和 Flash 模型进一步升级,发布稳定版和正式版。此外还将推出 2.5 Flash-Lite 预览版——迄今为止最具成本效益和速度最快的 2.5 模型。以下是Google公告全文:
感谢大家的反馈,今天我们发布了 Flash 和 Pro 2.5 的稳定版本,让您可以安心地构建生产应用程序。Spline和 Rooms 等开发者以及 Snap 和 SmartBear 等组织在过去几周内已经在生产环境中使用了最新版本。
Gemini 2.5 Flash-Lite 简介
我们还将推出全新 Gemini 2.5 Flash-Lite 的预览版,这是我们迄今为止最经济实惠、速度最快的 2.5 版本。您现在就可以使用预览版进行构建,我们期待您的反馈。
2.5 Flash Lite 在编码、数学、科学、推理和多模态基准测试中全面超越 2.0 Flash-Lite。它在翻译和分类等高容量、延迟敏感的任务中表现出色,在广泛的任务样本中,延迟低于 2.0 Flash-Lite 和 2.0 Flash。它具备 Gemini 2.5 的诸多实用功能,包括在不同预算下开启思维、连接 Google 搜索和代码执行等工具、多模态输入以及 100 万个 token 的上下文长度。
在最新的Gemini 技术报告中查看有关我们的 2.5 系列型号的更多详细信息。
Gemini 2.5 Flash-Lite 预览版现已在 Google AI Studio 和 Vertex AI 中上线,同时还提供 2.5 Flash 和 Pro 稳定版。2.5 Flash 和 Pro 版本均可在 Gemini 应用中访问。我们还为 Google 搜索功能引入了 2.5 Flash-Lite 和 Flash 的定制版本。