前言
前面分享了Stable diffusion文生图和提示词的内容,这次我们一起看下Stable diffusion的另一个重要模块:图生图
01、图生图概述

所有的AI设计工具,安装包、模型和插件,都已经整理好了,👇获取~
如果我们想用Stable diffusion生成这样的图片,使用文生图,应该怎样写提示词呢:

在这张图里,你能想到的关键词是:“树、山、河流、房子”,在文生图的过程中,要生成出这样一张符合期望的图片,不仅有提示词,还需要对色彩、构图等多个方面进行详尽的描述。尽管你写下长长的一串提示词,可能仍然难以达到你所预想的效果。

我们使用这些提示词生成的图片和原来的图片相差太大,达不到我们想要的效果,这时候我们怎么办呢?
通过SD的图生图参考处理,我们不仅可以向SD传达了生成图片的关键词信息,还可以提供一张图片作为参考。
即便只是利用简短的几个提示词,我们也能够轻松地生成一张与参考图片风格相近的图像:

然后使用重绘幅度这个参数来进行控制,数值越低,生成的图片越接近参考图:

数值越高,与参考图的差距也就越大,生成的图片画风也越接近你使用的模型。


01、图生图缩放模式


图生图的参数配置与文生图几乎一样。我们在掌握了文生图之后,学习图生图将会变得异常轻松。与文生图相比,图生图在参数设置上增加了四种缩放模式的选择,这些模式专门用于解决生成图片与参考图片分辨率不匹配的问题。
为了讲解方便,我暂时将重绘幅度设置为0。

我们参考图像的分辨率为954×534,通过手动拖动尺寸滑块,界面上会显示一个红色边框,便于我们判断生成图像的尺寸比例。

拉伸原图:当我将分辨率调整为1200×534,并选用拉伸作为缩放模式时,生成的图片将不再遵循原参考图的宽高比。因此,我们可以看到生成的图片宽度被拉长,而高度被压扁,以适应新的分辨率。

第二种缩放模式——裁剪原图,是在保持图像纵横比的同时,裁剪掉原始图像的多余部分并调整尺寸。如我们设置新生成的图像尺寸:1200X400,从生成的图片中我们可以看出,它相当于是在1200×534的原图上截取了一部分,并将截取后的图像调整为我们设置的大小。

第三种缩放模式——填充模式,可以看作是PS中的智能填充功能。它能够在保持图像纵横比的同时改变尺寸,并重新绘制空白区域。但需要注意的是,这个模式需要搭配重绘幅度一起使用。由于我之前设置的重绘幅度为0,所以它只会进行拉伸。当我提高重绘幅度后,填充效果就显现出来了,填充效果相当不错。
重绘幅度为0,对原图片拉伸,拉伸的情况可以很明显看出


增加重绘幅度到0.2,多出的部分根据原始图像进行重绘,但重绘的幅度不大


最后一种缩放模式-仅调整大小 (潜空间放大)。与拉伸模式类似,同样会改变原图的宽高比。不过,它在调整图片分辨率时使用了Upscaler算法。这个模式的使用频率相对较低。当重绘幅度为0时,虽然同样是拉伸效果,但这个模式生成的图片会显得比较模糊。搭配重绘幅度后,生成的效果会有所改善。
重绘幅度为0


重绘幅度0.2,重绘幅度调整的不大,重绘的效果不明显


在同样的参数下,使用不同的模式效果会有所不同。具体选择哪一种缩放模式,可以根据个人喜好和需求来决定。
02、反推提示词


在图生图界面中,有两个用于反推提示词的功能选项,Clip和DeepBooru。这2个SD自带的根据图片反推工具相对WD14-Tagger效果可能没那么完善,但兼容性好,我早期安装WD14-Tagger出现SD无法运行的问题,排查了很久也没查出来原因。

Clip反推提示词能够生成简短的句子,其重点在于揭示画面中各个对象之间的关联与互动:

而DeepBooru反推提示词则倾向于输出单个词汇,其核心在于描绘对象的独特特征,这一模式在描绘人物特征时尤为出色:

这2种反推提示词分析原图反推时,都会出现反推的场景不准,提示词错误问题,还需要人工进行修正。结合这两种反推提示词的不同特点,我们可以将它们结合使用,从多张图片中反推出提示词,并在图生图或文生图的过程中进行筛选与尝试应用:

03、更改画风小技巧


前面我们讨论重绘幅度数值的意义:数值越低,生成的图像越接近参考图;数值越高,则越贴近我们所用的模型风格。
如果我希望在保留参考图构图等元素的同时,又想要改变其画风,应该如何操作呢?既要…又要…,2个方面都要满足,太难了
操作方法来了:在文生图和图生图的生成框下方,都设有将已生成的图片再次发送到图生图、局部重绘和附加功能面板的选项。

我们先文生图生成个校园美女,然后把它转换成2.5D。具体方法:在文生图,输入提示词:a girl,campus,选择一个写实模型:MajicMixRealistic_V7

把这个照片和参数发送到图生图

在图生图中切换一个2.5D模型,重绘幅度调整为0.3

再将新生成的图片发送到图生图进行进一步的处理。
这个过程我会重复多次,每次都会从生成的图片中选择一个最适合的作为下一次生成的参考图。

重复这个操作大约5次左右,就能得到一张相对满意的图片了。

04、图生图绘图


在图生图功能的旁边,有一个绘图功能,相较于图生图,它的参数设置多了画笔以及画笔颜色的调节选项,这允许用户在参考图的基础上进行直接的编辑操作。
比如说,我现在想让女孩的部分头发变成黄色。直接在提示词添加黄色头发,效果可能并不尽如人意。

调整黄色头发提示词的权重到1.6,生成的女孩头发有黄色的部分,效果还可以

如果你只想头发中一部分变成黄色,修改提示词权重的方法就不行了,我们可以可以利用画笔工具,直接将头发部分涂成黄色,然后再次进行生成,就能得到一个拥有部分黄色头发的女孩了。

直接实现部分黄色头发的精准控制,好像有点难度,调整了多次,实现精准控制效果稍微有点不理想。但如果在头发部位加蝴蝶结效果就比较好。

关于AI绘画技术储备
学好 AI绘画 不论是就业还是做副业赚钱都不错,但要学会 AI绘画 还是要有一个学习规划。最后大家分享一份全套的 AI绘画 学习资料,给那些想学习 AI绘画 的小伙伴们一点帮助!
对于0基础小白入门:
如果你是零基础小白,想快速入门AI绘画是可以考虑的。
一方面是学习时间相对较短,学习内容更全面更集中。
二方面是可以找到适合自己的学习方案
包括:stable diffusion安装包、stable diffusion0基础入门全套PDF,视频学习教程。带你从零基础系统性的学好AI绘画!
零基础AI绘画学习资源介绍
👉stable diffusion新手0基础入门PDF👈


👉AI绘画必备工具👈

温馨提示:篇幅有限,已打包文件夹,获取方式在:文末
👉AI绘画基础+速成+进阶使用教程👈
观看零基础学习视频,看视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。

温馨提示:篇幅有限,已打包文件夹,获取方式在:文末
👉12000+AI关键词大合集👈

这份完整版的AI绘画全套学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

文章来源于互联网:AI绘图教程|Stable diffusion(SD)图生图及绘图模式参数详解
前言
前面分享了Stable diffusion文生图和提示词的内容,这次我们一起看下Stable diffusion的另一个重要模块:图生图
01、图生图概述


如果我们想用Stable diffusion生成这样的图片,使用文生图,应该怎样写提示词呢:

在这张图里,你能想到的关键词是:“树、山、河流、房子”,在文生图的过程中,要生成出这样一张符合期望的图片,不仅有提示词,还需要对色彩、构图等多个方面进行详尽的描述。尽管你写下长长的一串提示词,可能仍然难以达到你所预想的效果。

我们使用这些提示词生成的图片和原来的图片相差太大,达不到我们想要的效果,这时候我们怎么办呢?
通过SD的图生图参考处理,我们不仅可以向SD传达了生成图片的关键词信息,还可以提供一张图片作为参考。
即便只是利用简短的几个提示词,我们也能够轻松地生成一张与参考图片风格相近的图像:

然后使用重绘幅度这个参数来进行控制,数值越低,生成的图片越接近参考图:

所有的AI设计工具,安装包、模型和插件,都已经整理好了,👇获取~
数值越高,与参考图的差距也就越大,生成的图片画风也越接近你使用的模型。


01、图生图缩放模式


图生图的参数配置与文生图几乎一样。我们在掌握了文生图之后,学习图生图将会变得异常轻松。与文生图相比,图生图在参数设置上增加了四种缩放模式的选择,这些模式专门用于解决生成图片与参考图片分辨率不匹配的问题。
为了讲解方便,我暂时将重绘幅度设置为0。

我们参考图像的分辨率为954×534,通过手动拖动尺寸滑块,界面上会显示一个红色边框,便于我们判断生成图像的尺寸比例。

拉伸原图:当我将分辨率调整为1200×534,并选用拉伸作为缩放模式时,生成的图片将不再遵循原参考图的宽高比。因此,我们可以看到生成的图片宽度被拉长,而高度被压扁,以适应新的分辨率。

第二种缩放模式——裁剪原图,是在保持图像纵横比的同时,裁剪掉原始图像的多余部分并调整尺寸。如我们设置新生成的图像尺寸:1200X400,从生成的图片中我们可以看出,它相当于是在1200×534的原图上截取了一部分,并将截取后的图像调整为我们设置的大小。

第三种缩放模式——填充模式,可以看作是PS中的智能填充功能。它能够在保持图像纵横比的同时改变尺寸,并重新绘制空白区域。但需要注意的是,这个模式需要搭配重绘幅度一起使用。由于我之前设置的重绘幅度为0,所以它只会进行拉伸。当我提高重绘幅度后,填充效果就显现出来了,填充效果相当不错。
重绘幅度为0,对原图片拉伸,拉伸的情况可以很明显看出


增加重绘幅度到0.2,多出的部分根据原始图像进行重绘,但重绘的幅度不大


最后一种缩放模式-仅调整大小 (潜空间放大)。与拉伸模式类似,同样会改变原图的宽高比。不过,它在调整图片分辨率时使用了Upscaler算法。这个模式的使用频率相对较低。当重绘幅度为0时,虽然同样是拉伸效果,但这个模式生成的图片会显得比较模糊。搭配重绘幅度后,生成的效果会有所改善。
重绘幅度为0


重绘幅度0.2,重绘幅度调整的不大,重绘的效果不明显


在同样的参数下,使用不同的模式效果会有所不同。具体选择哪一种缩放模式,可以根据个人喜好和需求来决定。
02、反推提示词


在图生图界面中,有两个用于反推提示词的功能选项,Clip和DeepBooru。这2个SD自带的根据图片反推工具相对WD14-Tagger效果可能没那么完善,但兼容性好,我早期安装WD14-Tagger出现SD无法运行的问题,排查了很久也没查出来原因。

Clip反推提示词能够生成简短的句子,其重点在于揭示画面中各个对象之间的关联与互动:

而DeepBooru反推提示词则倾向于输出单个词汇,其核心在于描绘对象的独特特征,这一模式在描绘人物特征时尤为出色:

这2种反推提示词分析原图反推时,都会出现反推的场景不准,提示词错误问题,还需要人工进行修正。结合这两种反推提示词的不同特点,我们可以将它们结合使用,从多张图片中反推出提示词,并在图生图或文生图的过程中进行筛选与尝试应用:

03、更改画风小技巧


前面我们讨论重绘幅度数值的意义:数值越低,生成的图像越接近参考图;数值越高,则越贴近我们所用的模型风格。
如果我希望在保留参考图构图等元素的同时,又想要改变其画风,应该如何操作呢?既要…又要…,2个方面都要满足,太难了
操作方法来了:在文生图和图生图的生成框下方,都设有将已生成的图片再次发送到图生图、局部重绘和附加功能面板的选项。

我们先文生图生成个校园美女,然后把它转换成2.5D。具体方法:在文生图,输入提示词:a girl,campus,选择一个写实模型:MajicMixRealistic_V7

把这个照片和参数发送到图生图

在图生图中切换一个2.5D模型,重绘幅度调整为0.3

再将新生成的图片发送到图生图进行进一步的处理。
这个过程我会重复多次,每次都会从生成的图片中选择一个最适合的作为下一次生成的参考图。

重复这个操作大约5次左右,就能得到一张相对满意的图片了。

04、图生图绘图


在图生图功能的旁边,有一个绘图功能,相较于图生图,它的参数设置多了画笔以及画笔颜色的调节选项,这允许用户在参考图的基础上进行直接的编辑操作。
比如说,我现在想让女孩的部分头发变成黄色。直接在提示词添加黄色头发,效果可能并不尽如人意。

调整黄色头发提示词的权重到1.6,生成的女孩头发有黄色的部分,效果还可以

如果你只想头发中一部分变成黄色,修改提示词权重的方法就不行了,我们可以可以利用画笔工具,直接将头发部分涂成黄色,然后再次进行生成,就能得到一个拥有部分黄色头发的女孩了。

直接实现部分黄色头发的精准控制,好像有点难度,调整了多次,实现精准控制效果稍微有点不理想。但如果在头发部位加蝴蝶结效果就比较好。

这篇文章主要是说明和文生图不一样的参数,如果相同的参数,功能使用基本一样,如果有不理解的,可以参考对应的文生图部分。
关于AI绘画技术储备
学好 AI绘画 不论是就业还是做副业赚钱都不错,但要学会 AI绘画 还是要有一个学习规划。最后大家分享一份全套的 AI绘画 学习资料,给那些想学习 AI绘画 的小伙伴们一点帮助!
对于0基础小白入门:
如果你是零基础小白,想快速入门AI绘画是可以考虑的。
一方面是学习时间相对较短,学习内容更全面更集中。
二方面是可以找到适合自己的学习方案
包括:stable diffusion安装包、stable diffusion0基础入门全套PDF,视频学习教程。带你从零基础系统性的学好AI绘画!
零基础AI绘画学习资源介绍
👉stable diffusion新手0基础入门PDF👈


👉AI绘画必备工具👈

温馨提示:篇幅有限,已打包文件夹,获取方式在:文末
👉AI绘画基础+速成+进阶使用教程👈
观看零基础学习视频,看视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。

温馨提示:篇幅有限,已打包文件夹,获取方式在:文末
👉12000+AI关键词大合集👈

这份完整版的AI绘画全套学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

文章来源于互联网:AI绘图教程|Stable diffusion(SD)图生图及绘图模式参数详解
SD学习绘图最开始的第一步是文生图,这也是最基础的学习,今天我带大家先学习下文生图

有需要stable diffusion整合包可以扫描下方,免费获取

01
—
文生图参数
01
*模型选择
*
模型选择主要分大模型选择和VAE模型选择,这里根据你画的图具体进行选择,这个参数的选择难度不大。

02
**Clip跳过层****
Clip跳过层参数修改的比较少,为内容的完整性,简单阐述下它的作用。我们先开始测试看下,提示词输入“吉尼龟”、“可爱”、“帽子”和“水”这些关键词,固定种子点,调整Clip跳过层看下效果。
这里我们使用XYZ图表脚本进行对比测试

通过横向对比Clip跳过层从1到10的不同设置,并结合两个模型的纵向对比,我们可以观察到一个总体的趋势:随着Clip跳过层数值的增高,所生成的图像中缺失了我们在提词器中设定内容的情况就越为明显。

最后结论:Clip跳过层的数值设置得越高,生成的图片与提词器中的关键词之间的相关性就越低。
这个结论作为新手我们知道就可以,大部分情况使用默认值1,不用修改参数
03
*采样迭代步数*
采样迭代步数就是用多少次来计算你提示词里的内容,我们设置1-40迭代步数并在里面选取10张图片进行对比看下

可以看到,当步数设置得过低时,生成的图像几乎无法展现出任何内容。因此,通常建议将步数控制在30步以内,因为一旦超过这个范围,虽然可能会继续提升图片生成的质量,但所需的时间和对GPU显存会显著增加,而收益却可能相对有限。

04
*采样方法*
采样方法也就是不同的算法选择。我们在之前关于采样迭代步数的对比基础上,增加了对所有采样方法的对比,以便进行更为全面的纵向对比分析。

在选择采样方法时,最佳方法就是亲身尝试,并结合个人的偏好来做出选择。
当前,网络上最为流行的几种采样方式包括:Euler a、DPM++ 2M Karras、DPM++ SDE Karras以及DDIM。

05
*高清修复
*
高清修复功能主要图像的像素的扩大和高清处理,在一定程度上也可以帮助改善面部效果。
未开启高清修复,分辨率512*512,采样步数30,脸部稍微有点瑕疵

开启高清修复,分辨率1024*1024,采样步数30,放大算法:R-ESRGAN 4x+

脸部做了修复,但修复效果不是太好,这种情况最好进行脸部修复
对于三次元图像的处理,推荐选用R-ESRGAN 4x+算法;而对于二次元图像,则更适合使用R-ESRGAN 4x+ Anime6B算法。这两种算法在进行高清修复时通常能取得令人满意的效果。

一般来说,高清修复功能中的采样次数可以保持默认值0,这样它就会与采样迭代步数保持同步。
至于重绘幅度,该数值越高,最终生成的图像与原始图像的差异就会越大。通常情况下,将重绘幅度设置在0.4到0.7之间,效果会比较理想。
重绘幅度调整到1,生成的图像和原来差别较大

放大倍率这一参数,顾名思义,就是要在原有分辨率的基础上将图像放大多少倍。但需要注意的是,放大倍率不宜设置得过高,否则可能会导致显卡崩溃。一般来说,将放大倍率设置为2倍就足够了。

还需要注意的一点是,当遇到面部崩坏的情况时,面部修复和高清修复功能应该二选一,建议不要同时开启,否则可能会适得其反。
06
*分辨率
*
分辨率的设置比较关键,SD 1.5的模型训练的图片分辨率是512*512,

SD2.1模型训练图片分辨率新增了768768,这也就是说几乎所有的模型训练的尺寸都是512512或者768*768。当图像的分辨率过低。
如低于256×256时,SD的性能可能会受到限制,从而可能导致图像质量的降低。

然而,如果我们将分辨率设置得过高,比如超过1024×1024,SD可能会胡乱处理,导致构图出现问题,甚至产生不协调或怪异的效果。

具体分辨率的设置,建议至少确保其中一个宽度或高度为512或768像素。有些图像处理模型还会明确给出推荐的分辨率范围。

如果你确实希望生成高分辨率的图像,一个可行的做法是首先生成一个较小分辨率的图像,然后在此基础上应用高清修复功能来进一步提升图像的清晰度。
07
*生成批次和CFG
*
生成批次的概念很容易理解,它指的是每次生成多少组图像,而这些图像的随机种子则是按顺序递增的。

每批数量指的是每一组中包含的图像张数。如果我选择了生成3批图像,且每批数量为4张,那么最终我将得到总共12张图像。

CFG参数用于调节生成图像与给定提示词的相关性。该参数值越高,生成的图像越贴近提示词内容,但过高的设置可能会导致图像饱和度过高,出现过曝现象。

08
*随机数种子
*
说到随机种子,我们首先需要了解一下AI绘图的基本工作原理。简单来说,AI绘图的过程就是从一张噪声图开始,然后通过不断地调整和优化,使其逐渐接近并符合我们给出的提示词,最终生成出一张图片。
在这个过程中,随机种子就扮演着决定这张初始噪声图角色的重任。为了更直观地展示这一过程,我使用了DPM++ 2M Karras这种采样模式,并生成了一个从采样迭代步数1到15的对比图。

可以看到,当采样迭代步数为1时,画面呈现为一个纯粹的噪声图。随后,随着步数的逐渐增多,这些噪声开始慢慢汇聚、成形,最终演变成为一张完整的图片。

之前我们已经提到过,当你对某个生成效果感到满意时,可以点击那个环保的图标按钮来固定当前的随机种子。

在硬件环境和参数设置保持不变的情况下,这样做可以确保你每次生成的图片都能达到99%的相似度。

另外,如果你点击骰子按钮,随机种子的数值会变为-1,这意味着每次都会采用一个新的随机种子来生成图片。

此外,激活倒三角旁边的按钮后,你还可以额外设置一个随机种子。通过调整差异强度,你可以将这两个种子的图片进行混合处理。

至于下面的宽度和高度选项,它们实际上是指定生成图片时按照你给出的分辨率进行构图或应用效果,但最终图片的分辨率仍然取决于你之前设置的出图分辨率。这个功能相对来说使用得比较少。
02
—
吉尼龟案例实践
上面详细讲述文生图的各项参数,现在我们把最开始做的吉尼龟做完,使用的提示词:一个吉尼龟,可爱,帽子,水,一个批次生成5张图片
正向提示词:terpiece,best quality,lsquirtle,cute,hat,water,
反向提示词:lowres,bad anatomy,bad hands,text,error,missing fingers,extra digit,fewer digits,cropped,worst quality,low quality,normal quality,jpeg artifacts,signature,watermark,username,blurry,

出问题了,生成出的图片多了个女孩,跟我们只想要一个吉尼龟不相符,可以通过正向提示词中加入“没有人类”进行控制。
同时为了避免翻车,反向提词里我输入了“NSFW(不适合在工作时间浏览的内容)”,权重为1.4:,再一个批次生成5张图片,选择一张比较满意的固定种子点:

现在已经初步生成自己满意的吉尼龟形象,下面我们开始微调:
提词内首先把“一个吉尼龟,可爱,帽子,水”改成了“吉尼龟戴着绿色的帽子,红色眼睛,可爱,水”,角色用“chibi”,Q版形象,说明吉尼龟是一个Q版的,

再加上“站立,张开短手臂,短腿,微笑”,说明吉尼龟的动作,一个Q版形象的吉尼龟已经画出来

现在图片的分辨率是512*512,,打开高分辨率修复,扩大图片。放大算法使用R-ESRGAN 4x+,放大倍率:2倍,我想保持这个形象,重绘幅度使用0.3,不要太大重绘,先看下效果


是不是挺不错,如果文生图的过程中出现“多手”、“多肢体”,可以在反向提示词中进行控制,调整提示词顺序,避免出现这种不好的现象!
关于AI绘画技术储备
学好 AI绘画 不论是就业还是做副业赚钱都不错,但要学会 AI绘画 还是要有一个学习规划。最后大家分享一份全套的 AI绘画 学习资料,给那些想学习 AI绘画 的小伙伴们一点帮助!
对于0基础小白入门:
如果你是零基础小白,想快速入门AI绘画是可以考虑的。
一方面是学习时间相对较短,学习内容更全面更集中。
二方面是可以找到适合自己的学习方案
包括:stable diffusion安装包、stable diffusion0基础入门全套PDF,视频学习教程。带你从零基础系统性的学好AI绘画!
零基础AI绘画学习资源介绍
👉stable diffusion新手0基础入门PDF👈
(全套教程文末领取哈)

👉AI绘画必备工具👈

温馨提示:篇幅有限,已打包文件夹,获取方式在:文末
👉AI绘画基础+速成+进阶使用教程👈
观看零基础学习视频,看视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。

温馨提示:篇幅有限,已打包文件夹,获取方式在:文末
👉12000+AI关键词大合集👈

这份完整版的AI绘画全套学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

文章来源于互联网:AI绘图教程|Stable Diffusion(SD)文生图参数详解及吉尼龟小案例