DALL-E文本到图像AI模型迎来边界画幅扩展升级 很快就被网友们玩坏
上周,OpenAI 为其“文本到图像”AI 模型 DALL-E 添加了“outpointing”功能,为系统带来了能够拓展任何给定图片边界的功能。在此基础上,许多网友开始通过 Beta 测试阶段的每月 50 次免费访问来生成新的视觉效果,并在社交网络上分享了许多有趣的内容。
以《戴珍珠耳环的少女》为例,你可看到 DALL-E 是如何在人工智能技术的加持下,“想象”出在 Johannes Vermeer 画框之外的场景。
让人感到震惊的是,即使仅提供了相当有限的初始信息,AI 系统还是能够努力匹配原画作者的风格 —— 比如物体的阴影和高光。
Extend creativity and tell a bigger story with DALL-E images of any size(via)
在 Twitter 上分享的这段视频中,艺术家 August Kamp 展示了如何将图像逐级“放大”。可知 DALL-E 会经常随着画幅的扩展,而重新计算出匹配的画面。
《玩扑克的狗》(油画原作者为 Cassius Marcellus Coolidge)
需要指出的是,DALL-E 的系统并没有单独生成扩展出来的画面。与所有“文本转图形”AI 一样,该模型同样要求人类辅助描述想要看到怎样的视觉效果。
“末世”蒙娜丽莎
随着公测的开启,网友们也开始疯狂地拿 DALL-E 对各个“世界名画”开涮。
光影朝向不对劲的派拉蒙片头
此外尽管许多“文本到图像”AI 模型都有提供类似的画幅延伸功能,但它们往往与升级前的 DALL-E 一样,需要相当繁杂的人工介入。
这位骑马的男子,有一个响当当的名字(拿破仑)。
在 Beta 测试阶段,OpenAI 有提供超百万的用户访问。如果用完了一个月 50 次的免费服务,也可支付 15 美元来购买 115 次额外的图像生成。
披头士《Abbey Road》专辑封面(原版只有四人走过人行道)
“桂格”震怒(假如该燕麦品牌的形象代言人是一位身材丰满的酒吧女招待)