Google推出最新图像生成模型Nano Banana Pro
Google升级了旗下图像生成模型,推出新一代 Nano Banana Pro,在图像编辑能力、更高分辨率、更精准的文字渲染以及联网搜索方面均有所增强。

这一新模型基于Google本周早些时候刚刚发布的最新大语言模型 Gemini 3 打造。Google称,与前一代 Nano Banana 相比,Nano Banana Pro 能够生成更细致的画面和更准确的文字,并支持以不同风格、字体和语言生成文本内容。
Google展示的示例图片显示,Nano Banana Pro 可以生成一张关于如何制作小豆蔻奶茶(elaichi chai)的信息图。
值得一提的是,新模型具备网页搜索能力,用户可以让它先在网上查找菜谱,再基于搜索结果生成学习卡片等内容。
Google表示,Nano Banana Pro 更偏向为专业用户服务,强调对图像的精细控制。用户可以调节相机角度、场景光线、景深、对焦以及色彩分级等多项参数。与上一代 Nano Banana 最高 1024×1024 像素的分辨率上限相比,Nano Banana Pro 支持生成 2K 或 4K 分辨率图像。

不过,Google也指出,在提供更高质量图像的同时,Nano Banana Pro 的生成速度更慢、成本也高于前代。此前,Nano Banana 生成一张 1024 像素图像的价格为 0.039 美元,而 Nano Banana Pro 生成一张 1080p 或 2K 图像的价格为 0.139 美元,生成一张 4K 图像的价格则为 0.24 美元。
在生成能力方面,新模型最多可以利用 6 张高保真照片进行生成,或在同一图像中融合多达 14 个对象。同时,它还能在画面中保持最多 5 个人物的一致性和相似度。Google已经上线一款演示应用,用户可以在其中体验这些功能。
在产品整合上,Nano Banana Pro 正陆续接入Google现有多款 AI 工具。Gemini 应用将默认使用这一新模型进行图像生成,不过,免费订阅用户可使用 Nano Banana Pro 生成的图片数量有限,超出额度后将自动切回原始 Nano Banana 模型。
付费的 Google AI Plus、Pro 和 Ultra 订阅用户将获得更高的生成配额,但Google并未披露具体上限。这些订阅用户还可以在 Notebook LM 中调用该模型。
此外,Google还将在搜索产品中,向美国地区的 AI Pro 和 Ultra 订阅用户,在“AI 模式”下提供 Nano Banana Pro 支持。Ultra 用户还可在公司的视频工具 Flow 中调用这一模型;企业 Workspace 客户则可以在 Google Slides 和 Vids 中使用 Nano Banana Pro。
对于开发者,Nano Banana Pro 可以通过 Gemini API、Google AI Studio 以及Google新推出的集成开发环境(IDE)Antigravity 进行访问和调用。
在安全与标识方面,Google宣布将把其 AI 图像水印技术 SynthID 集成进 Gemini 应用。用户可以上传图片,由聊天机器人判断该图像是否由Google的图像模型生成或经过其模型修改。
Google并未透露是否计划支持诸如 C2PA 等其他 AI 水印标准。


