《蜘蛛侠:纵横宇宙》上映短短几天,电影就已经收获了大量的赞誉。新奇的视觉风格、光怪陆离的表现、加量再加量的蜘蛛侠,以及蜘蛛格温和迈尔斯的感情,所有的一切都被网友们所称赞。
作为本身受众较小的动画电影,蜘蛛侠全球首周就达到了2.08亿美元,持观望态度的小伙伴一定要去看。关于剧情本身不在这里过多剧透,不过相信看过电影的同胞,一定都对蜘蛛侠的小女友格温记忆深刻,今天我们就用AI来绘制一个属于自己的蜘蛛女友。
工具用的是Stable Diffusion,这里还要感谢B站大佬【秋葉aaaki】的整合包,它整合了启动器、模型下载、代理设置、Python、Github等国内镜像。否则光是网络环境,就让人头疼很久,即便本地部署好了,再次启动也有可能因为网络问题而报错。
这是选择SD中的大模型,我们所有生成图片的风格都和它有关,它往往决定了你生成的图片是欧美、日韩、卡通,还是风景。
这个好理解,正提示词就是想出现什么元素,反向提示词就是不要出现什么。对于新手不太了解的,可以直接复制一些万能的,至少生成出来的不会太畸形。
另外,如果找一些现成的标签,会发现里面各种中括号小括号,这是加权和减权的意思。如果所有标签都是平等权重的话,那么括号中的一般来说就是AI生产成相关性更大的提示词。比如:
上面的(worst quality:2)就是2倍权重不要出现坏的质量,而出现双括号的情况则是相乘,单括号默认是1.1倍权重,双括号就是1.1×1.1=1.21
默认为20,通常在20-40之间,视不同模型而定,有的模型20容易脸崩。但迭代步数越高,生成的速度越慢,人物相对来说越固定,也就是接近原模型。
在同一模型中,Steps 20能够看到画面整体更朦胧一些,也并不太像真人;而Setps 40则与真人无异。但相对的Steps 20生成的图像也更自由,更天马行空一些。
而最后的生成批次和每批数量,则决定了最终出图数量。要注意每批数量指的是AI生成一次的图片数量,它们风格基本相同;而生成批次则是每一张都独立运算,风格随机性很大。
提示词相关性代表输入标签的引导程度,太大会出现画面崩坏,太小AI则会自由发挥。这项数值默认为7,步进单位为0.5,一般在3-9为宜。
比如我们用同一组提示词,其他设置完全相同,能看到相关性在2左右,AI画的就会天马行空,不过谁能拒绝一张偷地雷的蜘蛛侠呢;而相关性在10左右,就会出现油画一样的效果。
比如在同一LORA插件下,使用不同大模型,就会出现截然不同的风格。可以说大模型是用来定基调的,小模型则是用来定风格的。
这个周边数量放眼整个显卡界也是数一数二的,如果你是小蜘蛛的粉丝,那么这款索泰RTX 4070 AMP AIRO SPIDER MAN显卡一定不要错过。
作为RTX 40系显卡,我们也对SD生成时间做了对比。在提示词相同,迭代步数50、尺寸768×768、生成批次10每批数量2、提示词相关性7.5的固定环境下,我们得出了与RTX 3070 Ti的生成时间对比。
Stable Diffusion对于显卡的要求比较高,这就需要显卡拥有较强的Tensor算力。RTX 40系显卡相比上一代产品,虽然光栅算力提升不大,但是在光追和AI方面都有成倍的提升。