早在 12 月份,Google 首次宣布了 Gemini 2.0 Flash 机型,该机型在关键基准测试中的表现优于 Gemini 1.5 Pro 机型,速度也提高了 2 倍。 Gemini 2.0 Flash 支持多模态输入(如图像、视频和音频)和多模态输出(如文本、图像和音频)。
今天,Google宣布Gemini 2.0 Flash 模型将成为网络和移动平台上所有 Gemini 应用程序用户的默认模型。 在接下来的几周内,Google 将继续提供旧版的 Gemini 1.5 Flash 和 1.5 Pro 模式,以便用户能够继续其现有的对话。
Gemini 团队成员帕特里克-凯恩(Patrick Kane)就双子座 2.0 Flash 的可用性撰文如下:
Gemini 应用程序现在使用 Gemini 2.0 Flash。 该模式可在多个关键基准方面提供快速响应和更强的性能,为头脑风暴、学习或写作等任务提供日常帮助。
Gemini 应用现在采用了 Imagen 3,这是 Google 最先进的图像生成模型,可以根据文本输入创建更精确的图像,并具有更丰富的细节和纹理。 Gemini 和 Gemini Advanced 用户只需使用文本描述他们想要创建的图像,Gemini 就能生成人工智能创建的图像。 不过,Gemini 高级用户也可以创建以人物为主题的图像。
在提供新的 Gemini Flash 2.0 模型的同时,Gemini 高级用户还可以访问 1M 标记上下文窗口,从而可以上传大量文件,并优先访问深度研究等新功能。
开发人员现在可以通过 AI Studio 和 Vertex AI 访问 Gemini 2.0 Flash 模型。 新的多模式实时 API 支持实时音频、视频流输入,并能使用多种组合工具。 随着 Gemini 2.0 Flash 模型和 Imagen 3 的发布,Google将继续为用户和开发者带来先进的人工智能功能。