Stability AI发布最新图像生成模型Stable Diffusion XL 1.0

摘要:

Stability AI 宣布推出 Stable Diffusion XL 1.0,这是一个文本到图像的模型,该公司称其为迄今为止"最先进"的版本。Stable Diffusion XL 1.0 在 GitHub 上以开源形式发布,此外还有 Stability 的 API 和消费者应用 ClipDrop 和 DreamStudio,Stability 声称,与前代产品相比,Stable Diffusion XL 1.0 的色彩"更鲜艳"、"更准确",对比度、阴影和光照效果也更好。

064.webp

Stability AI 的应用机器学习主管 Joe Penna 在接受采访时指出,Stable Diffusion XL 1.0 包含 35 亿个参数,可以在"几秒钟内"生成多种长宽比的 100 万像素分辨率的完整图像。"参数"是模型从训练数据中学到的部分,基本上定义了模型处理问题的技能,这里指的是生成图像。

上一代稳定扩散模型 Stable Diffusion XL 0.9 也能生成更高分辨率的图像,但需要更多的计算能力。

Penna 说:"Stable Diffusion XL 1.0 是可定制的,可以根据概念和风格进行微调。它也更易于使用,只需基本的自然语言处理提示,就能完成复杂的设计。"

Stable Diffusion XL 1.0 还在文本生成方面进行了改进。Penna 说,许多最好的文本到图像模型都很难生成带有可读徽标的图像,更不用说书法或字体了,而 Stable Diffusion XL 1.0 却能"高级"地生成文本,而且清晰可读。

此外,据 SiliconAngle 和 VentureBeat 报道,Stable Diffusion XL 1.0 支持内绘(重建图像的缺失部分)、外绘(扩展现有图像)和"图像到图像"提示--这意味着用户可以输入一张图像并添加一些文字提示,以创建该图像的更多细节变化。此外,该模型还能理解用简短提示给出的复杂、多部分指令,而以前的 Stable Diffusion 模型则需要较长的文本提示。

Old-man-Image.webp

Stable Diffusion XL 1.0 生成的图片。图片来源:Stability AI

他补充说:"我们希望,通过发布这个功能更强大的开源模型,图像的分辨率不会是唯一翻两番的地方,而且还能让所有用户大大受益。"

但与之前版本的 Stable Diffusion 一样,该模型也引发了棘手的道德问题。从理论上讲,开源版本的 Stable Diffusion XL 1.0 可以被不怀好意者用来生成有毒或有害的内容,比如未经同意的深度伪造。这在一定程度上反映了用来训练它的数据:来自网络的数百万张图片。

无数教程展示了如何使用稳定人工智能自己的工具(包括稳定扩散的开源前端 DreamStudio)来创建深度伪造内容。还有无数教程展示了如何微调基础稳定扩散模型来生成色情内容。

Penna并不否认滥用的可能性--他也承认该模型存在一定的偏差。但他补充说,Stability AI 已经采取了"额外措施",通过过滤模型训练数据中的"不安全"图像、发布与问题提示相关的新警告以及尽可能多地屏蔽工具中的个别问题术语,来减少有害内容的生成。

Stable Diffusion XL 1.0 的训练集还包括一些艺术家的作品,这些艺术家曾抗议包括 Stability AI 在内的公司将他们的作品用作生成式人工智能模型的训练数据。Stability AI 声称,至少在美国,合理使用原则免除了它的法律责任。但这并没有阻止几位艺术家和图片公司 Getty Images 提起诉讼,要求停止这种做法。

稳定人工智能公司(Stability AI)与初创公司 Spawning 合作,尊重这些艺术家的"退出"请求,该公司表示,它还没有从训练数据集中删除所有标记的艺术作品,但它"将继续采纳艺术家的请求"。

"我们正在不断改进稳定扩散的安全功能,并认真地继续迭代这些措施,"Penna说。"此外,我们还承诺尊重艺术家的要求,将其从训练数据集中删除。"

在发布 Stable Diffusion XL 1.0 的同时,Stability AI 还在其 API 的测试版中发布了一项微调功能,允许用户使用少至五张图片来"专业化"生成特定的人物、产品等信息。该公司还将把 Stable Diffusion XL 1.0 移植到亚马逊用于托管生成式人工智能模型的云平台 Bedrock 上,扩大了之前宣布的与 AWS 的合作。

Stability公司在商业化道路上遭遇低谷,面临着来自OpenAI、Midjourney等公司的激烈竞争,因此该公司推动建立合作伙伴关系并开发新功能。今年4月,Semafor报道称,迄今为止已募集到1亿多美元风险资金的Stability AI公司正在烧钱--这促使该公司在6月完成了一笔2500万美元的可转换票据,并猎聘了一名高管来帮助提高销售额。

"最新的SDXL模型代表了Stability AI的创新传统和能力的下一步,即为人工智能社区提供最前沿的开放式访问模型,"Stability AI首席执行官埃马德-莫斯塔克(Emad Mostaque)在一份新闻稿中说。"在亚马逊Bedrock上发布1.0版本表明了我们与AWS合作,为开发者和客户提供最佳解决方案的坚定承诺"。

查看评论
created by ceallan