Google最新发布的Gemini 2.5 Flash AI模型更加注重效率

Google正在发布一种新的人工智能模型，旨在提供强大的性能并注重效率。该模型名为 Gemini 2.5 Flash，即将在Google的 AI 开发平台 Vertex AI 上推出。该公司表示，该模型提供“动态且可控”的计算能力，允许开发人员根据查询的复杂性调整处理时间。

Google在一篇博客文章中写道：“用户可以根据自己的特定需求调整速度、准确性和成本平衡。这种灵活性对于在高容量、成本敏感的应用中优化 Flash 性能至关重要。”

Gemini 2.5 Flash 的发布正值旗舰 AI 模型价格持续上涨之际。像 2.5 Flash 这样价格更低、性能更强大的模型，虽然牺牲了一定的准确度，但却为昂贵的顶级产品提供了一个极具吸引力的替代方案。

Gemini 2.5 Flash 是一款“推理”模型，类似于 OpenAI 的o3-mini和 DeepSeek 的R1。这意味着它需要更长的时间来回答问题，以便进行事实核查。

Google表示，2.5 Flash 非常适合客户服务和文档解析等“大容量”和“实时”应用。

Google在其博客文章中表示：“这款主力机型专门针对低延迟和降低成本进行了优化。对于响应式虚拟助手和实时摘要工具而言，规模效率至关重要，因此它是理想的引擎。”

Google尚未发布 Gemini 2.5 Flash 的安全或技术报告，这使得了解该模型的优势和不足之处变得更加困难。该公司此前曾表示，它不会发布其认为是“实验性”的模型的报告。

Google周三还宣布，计划从第三季度开始将 2.5 Flash 等 Gemini 模型引入本地环境。该公司的 Gemini 模型将在Google分布式云 (GDC) 上提供，GDC 是Google为有严格数据治理要求的客户提供的本地解决方案。Google表示，它正在与 NVIDIA 合作，将 Gemini 模型引入符合 GDC 标准的 NVIDIA Blackwell 系统，客户可以通过Google或其首选渠道购买。