OpenAI 发布第三版 DALL-E 人工智能视觉模型

OpenAI 发布了其生成式人工智能视觉艺术平台 DALL-E 的第三个版本，现在用户可以使用 ChatGPT 创建提示，并包含更多安全选项。DALL-E 将文本提示转换成图像。但即使是 DALL-E 2 也会出错，经常忽略特定的措辞。OpenAI 的研究人员说，最新版本能更好地理解上下文。

DALL-E 3 的一个新功能是与 ChatGPT 集成。通过使用 ChatGPT，用户不必自己编写详细的提示来引导 DALL-E 3；他们只需让 ChatGPT 想出一个提示，聊天机器人就会写出一段话（DALL-E 更擅长使用长句），让 DALL-E 3 跟着说。如果其他用户对 DALL-E 有特别的想法，也可以使用自己的提示。

DALL-E 于 2021 年 1 月首次发布，发布时间早于 Stability AI 和 Midjourney 的其他文本到图像生成 AI 艺术平台。到 2022 年 DALL-E 2 发布时，OpenAI 开设了一个等待名单，以控制谁能使用该平台，因为有批评称 DALL-E 可以生成逼真的露骨图像，并且在生成照片时表现出偏见。去年 9 月，公司取消了等待名单，向公众开放了 DALL-E 2。

新版 DALL-E 将于 10 月首先向 ChatGPT Plus 和 ChatGPT Enterprise 用户发布，随后在秋季向研究实验室及其 API 服务发布。OpenAI 计划错开 DALL-E 3 的发布时间，但没有承诺何时发布免费的公开版本。

OpenAI 声称，它在 DALL-E 3 上做了大量工作，重点是创建强大的安全措施，以防止创建淫秽或潜在的仇恨图像。OpenAI表示，它与外部红队（red teamers）合作--红队是一个故意试图破坏系统以测试其安全性的组织--并依靠输入分类器（input classifiers），这是一种教语言模型忽略某些单词以避免明确或暴力提示的方法。DALL-E 3 也无法再现公众人物的形象--前提是提示中明确提到了名字。

该公司的政策研究员桑迪尼-阿加瓦尔（Sandhini Agarwal）说，她对该公司的安全措施"非常有信心"，但她澄清说，该模型在不断改进，并不完美。OpenAI 的代表在一封电子邮件中说，DALL-E 3 已被训练成不会按照在世艺术家的风格生成图像。与 DALL-E 2 不同的是，DALL-E 2 在受到提示时可以模仿某些艺术家的艺术风格。

可能是为了避免潜在的诉讼，OpenAI 还将允许艺术家选择将他们的艺术作品排除在未来版本的文本到图像人工智能模型之外。创作者可以提交自己拥有版权的图片，并在网站上填写表格要求将其移除。这样，未来版本的 DALL-E 就可以屏蔽与艺术家的图像和风格相似的结果。艺术家们起诉了 DALL-E 的竞争对手 Stability AI 公司和 Midjourney 公司，以及艺术网站 DeviantArt，指控它们使用他们拥有版权的作品来训练文字图像模型。