返回上一页  首页 | cnbeta报时: 18:19:23
字节登顶世界最强图像AI 一手实测原生4K、10图融合
发布日期:2025-09-12 16:16:21  稿源:新智元

Google Nano Banana一夜爆火之后,各种邪修玩法儿,至今让全网意犹未尽。等距视角、多图合成、老照片修复、3D手办.......创意脑洞大开,全网玩疯。


谁曾想,短短半个月后,大洋彼岸就杀出来了一个最强逆袭者!

就在刚刚,字节跳动发布的豆包·图像创作模型Seedream 4.0,一举拿下了Artificial Analysis“文生图”和“图像编辑”两大榜单的第一。




一键创作+编辑,原生4K分辨率,一次最多上传10张参考图。

如今,全网的画风是这样子的——





左右滑动查看

有网友随手扔了一张糊到爹妈都不认的图,Seedream 4.0直出一张超清版的,简直是废片秒变神作。



生图不仅是它的强项,Seedream 4.0还具备了超强的知识和推理能力。

就比如,一边生图,一边解方程;生成的冰激凌配方图,逻辑清晰;一键比较建筑特点,美观且要点明了......





左右滑动查看

这是因为,Seedream 4.0首次将“生成图像”和“图像编辑”(SeedEdit 3.0),全部整合到单体模型中。

相较于上一代,4.0版本生成文字清晰又准确,尤其是在中文文字渲染上,效果碾压GPT-4o、Gemini 2.5 Flash。

比如,我们想把下面这听饮料上面的字换成“新智元”。


Seedream 4.0给出的结果,不仅光影正确,而且字体也很有设计感。


相比之下,GoogleNano Banana生成的,除了“新”字之外,可以说是是驴唇不对马嘴。


更多对比如下:





左右滑动查看

可以说,Seedram 4.0的横空出世,一夜之间掩盖了Google“香蕉”所有光芒。

现在,打开“火山方舟体验中心”,就可以免费体验4K高清多模态生图了!



点击【阅读原文】即可直达,传送门:https://www.volcengine.com/experience/ark?launch=seedream

一手实测,更适合中国宝宝

多图融合,是最常见的一种玩法儿。

不论是“双人同框”,还是每日穿搭、模仿火柴人动作草图等等,Seedream 4.0可以全部拿捏。

甚至,一次上传10张参考图,它都能以正确的逻辑融合成一张图。

十图无缝合成,生成专属OOTD

就比如,今日份OOTD穿搭,Seedream 4.0就能直接帮你承包了。


让图1女孩穿上图2的穿搭

上传一张个人照片,再淘一张穿搭图,上身效果如何,几秒就能get了。

令人惊艳的是,照片生成的太自然了,人物一致性非常高,肉眼根本辨别不出是AI生成的。


再换一套简约风格的,果然人美穿啥都好看。


接下来加大难度,一次上传八张图片:一张主角,五张配饰,外加一只杜宾和一辆吉普汽车。

为了让图像呈现得更加美观,提示要求男子站在汽车一旁,狗紧挨着男主。


图1的男子穿上第2、3、4、5、6张图的穿搭,站在第八张图汽车前,第七张图小狗站在男人身旁

不得不说,Seedream 4.0理解力一绝,还能准确地给男主穿上衣服,戴上配饰。


随便一个pose模板,Seedream 4.0便可以让任何人做出相同的动作。

一位古装女子和一位画上的皇帝,做图3的摆拍,那会是怎样的效果?


将图1、图2合进一张图里,参考图3姿势

快看,这张合照堪称“天作之合”,真是挑不出一点毛病,比拍照还真。


再比如,自己想要一张和霉霉合照,Seedream 4.0就可以帮你实现愿望。


图1和图2女生合拍,两人表现自然一些,背景是上海东方明珠夜景

上传两张图后,一句话,即可无缝合成。

可以看到,照片中人物的衣服、头发颜色等细节非常一致,而且动作自然,没有出现人物失真的情况。


现场手绘一个“火柴人”,就让犬夜叉和杀生丸来一个打斗摆拍。


让图1和图2两个人,模仿图3的姿势

没想到,就这么随笔一画,让Seedream 4.0就让动漫人活灵活现了。


还有3D物理世界小人,Seedream 4.0也可让其动作1:1复刻。


图1女生做图2的动作

连续生图,淘汰制片人?

想连续做动画或视频,缺少灵感?

Seedream 4.0还具备了强大的“连续生图”的能力,只要输入剧情描述,AI即可自动生成多个关键画面帧。

最后,再借助AI视频工具,合成动态视频。

从故事脚本到视觉呈现,一个人即可轻松搞定Vlog、创意短片,从此制作效率翻倍。

举个栗子,你可以让名画中的人,在同一时空下相遇。


图1的梵高和图二的蒙娜丽莎,在图3的一家酒吧里偶遇,然后两人在图4露天小餐馆畅谈,需要环境的局部特写,比如酒馆的光影,酒杯特写等。

梵高和蒙娜丽莎在一家酒吧偶遇后,两人又去户外小餐馆畅聊。


动漫连载,下一个宫崎骏是你

我们再来做一个动漫连环画,上传一张有人物角色的照片。


然后,若是想要指定的画面,把所有故事分镜的脚本扔给Seedream 4.0。

保持封面参考图的绘画风格和封面的主体,下面每句话帮忙生成一句故事分镜(一共5个分镜):

1. 夏日清晨,小女孩背着绣小熊的布包,牵着卷毛小狗从家门口出发,门廊竹席上还放着没喝完的绿豆汤。

2. 两人走到公园长椅旁,小狗突然追着粉蝴蝶跑远,小女孩举着刚摘的狗尾草。

3. 路过野菊花丛,小女孩蹲下来摘小黄花,小狗叨起一朵送到她手边,花瓣上还有露珠。

4. 听到远处卖冰粉的叫卖声,小女孩牵着小狗跑过去,买了碗红糖冰粉,用小勺子喂小狗尝了口。

5. 突然下起小雨,小女孩拉着小狗躲进公园的木亭子,小狗缩在她脚边,用脑袋挨着她。

不一会儿工夫,五个分镜全部出来了。画面效果非常惊艳,而且人物画面全部保持一致。






左右滑动查看

电影分镜,堪比好莱坞大片

一直以来,人们都难以相信,一款AI工具如何能砸掉制片人的饭碗?

当你真正体验之后,就会惊叹这就是现实!

接下来,上传一张女主和一张男主的照片,任何人就可以直接拍出一部短剧。


prompt:参考图片形象,生成三种影视分镜:第一幕女主去买帽子;第二幕转角遇到了图2的帅气男子;第三幕男主向女主表达爱慕,两人微笑。复古风格。

第一幕:女主去买帽子。

值得一提的是,在第一幕画面生成中,Seedream 4.0还整了一个高难度——镜面。

可以看到,女主表情和镜子中一致,包括帽子、耳钉、珍珠项链、衣服等等,和原图保持高度一致。


第二幕,女主出门转角,偶遇到了男主。

这一幕中,Seedream 4.0放大了视角,营造了一种“魔法版”的偶遇,逼真还原了男女主。


第三幕,男主向女主表达爱慕。

注意看,这里的镜头又被拉近,男女主之间的甜蜜溢出了屏幕,一根羽毛成为了他们之间爱情的见证。


是不是感觉情节太过精彩,还没有看够。不如,接下来的故事,就由你们来续写~

创意玩法,脑洞大开

除了多图融合、连续生图,Seedream 4.0还有各种本领。

比如,让它取出汉堡的所有馅料,只保留顶部和底部的面包片。而且,两个面包片之间空隙间隔,要与原来的一致。


Remove all the ingredients from the burger and keep only the top and bottom buns. Leave a gap between them, keeping the same spacing as if the fillings were still inside.

一个只有面包,没有夹层的汉堡就闪现了。


它还可以生成一个可爱小狗的桌面手办。


根据草图,生成对应主体的立体搪胶手办,摆放在深色电脑桌上

除了图片的生成和编辑外,Seedream 4.0还拥有智能——它真的理解图片上的内容。

比如让它推断生成,一张上海东方明珠照片12个小时后的样子。


12个小时后,城市展示的景色

模型不仅正确推断出12小时后是夜景,而且建筑物的细节、角度等也都非常完美的还原。

补全后的4k图像真的是相当清晰。


再比如,给它一个时间,然后问1分钟之后会显示什么。


Seedream 4.0也能正确推断出相应的时间,而且其他参数也都没有随意改动。

草图建模也不在话下。

设计师有福了。


根据草图,设计出完整建筑,并上色

可以看到,模型不仅完美还原出建筑的设计细节以及外部材料的质感,为了方便展示顶部的设计,它甚至还改变了视角。

简直太贴心了。


还可以反过来玩,将建筑转换成模型,而且是不同的角度。

这都需要模型进行很多推理。


把建筑做成不同视角的全景模型,白色的背景,微缩模型,需要四张,不同角度,分别是鸟瞰图、顶视图、侧视图、仰视图


最近还流行的一种玩法是制作教程。

比如让Seedream 4.0生成一张牛肉汉堡制作步骤教程图,绘制在手账本上。

可以看到最后的教程步骤清晰,实用性很高。


彩铅手账风格,出一个牛肉汉堡制作步骤教程图,步骤说明要中文,女生手写可爱字体,绘制在一个手账本上

更进一步的应用是制作信息图表。

这个应用不仅好玩儿,还更有教育意义——一下子把枯燥的文字知识变成图表,让学习的效率指数型上升。

举个栗子:牛顿第二定律。


提示词:“牛顿第二定律”信息图表,包括科普文字、示意图和基础物理公式,分列进行排版

太香了。上学时要是有这东西,我的成绩绝对还能上升两个层次。

一键接入API

当然,作为一家云平台,火山引擎也支持API接入,面向开发者解锁更多玩法。


在火山引擎拿到自己的API KEY后,只需点击上图中的API接入,就可以看到调用的示例代码。


在红框内换成自己的API KEY后,直接复制代码放到终端即可。

大家看一下Seedream 4.0文生图的质量。

生成3张女孩和奶牛玩偶在游乐园开心地坐过山车的图片,涵盖早晨、中午、晚上


除了文生图外,API还支持图生图、多图融合、组图输出等多种玩法,大家可以自己去体验。


我们在FebBox(https://www.febbox.com/cnbeta) 开通了新的频道,更好阅读体验,更及时更新提醒,欢迎前来阅览和打赏。
查看网友评论   返回完整版观看

返回上一页  首页 | cnbeta报时: 18:19:23

文字版  标准版  电脑端

© 2003-2025