Google正在发布一种新的人工智能模型,旨在提供强大的性能并注重效率。该模型名为 Gemini 2.5 Flash,即将在Google的 AI 开发平台 Vertex AI 上推出。该公司表示,该模型提供“动态且可控”的计算能力,允许开发人员根据查询的复杂性调整处理时间。
Google在一篇博客文章中写道:“用户可以根据自己的特定需求调整速度、准确性和成本平衡。这种灵活性对于在高容量、成本敏感的应用中优化 Flash 性能至关重要。”
Gemini 2.5 Flash 的发布正值旗舰 AI 模型价格持续上涨之际。像 2.5 Flash 这样价格更低、性能更强大的模型,虽然牺牲了一定的准确度,但却为昂贵的顶级产品提供了一个极具吸引力的替代方案。
Gemini 2.5 Flash 是一款“推理”模型,类似于 OpenAI 的o3-mini和 DeepSeek 的R1。这意味着它需要更长的时间来回答问题,以便进行事实核查。
Google表示,2.5 Flash 非常适合客户服务和文档解析等“大容量”和“实时”应用。
Google在其博客文章中表示:“这款主力机型专门针对低延迟和降低成本进行了优化。对于响应式虚拟助手和实时摘要工具而言,规模效率至关重要,因此它是理想的引擎。”
Google尚未发布 Gemini 2.5 Flash 的安全或技术报告,这使得了解该模型的优势和不足之处变得更加困难。该公司此前曾表示,它不会发布其认为是“实验性”的模型的报告。
Google周三还宣布,计划从第三季度开始将 2.5 Flash 等 Gemini 模型引入本地环境。该公司的 Gemini 模型将在Google分布式云 (GDC) 上提供,GDC 是Google为有严格数据治理要求的客户提供的本地解决方案。Google表示,它正在与 NVIDIA 合作,将 Gemini 模型引入符合 GDC 标准的 NVIDIA Blackwell 系统,客户可以通过Google或其首选渠道购买。