AI大模型教程
一起来学习

SD+ ControlNet (边缘图+颜色图),扩散模型+约束条件关于颜色因子的探索实验(二)完结,实现服装图像生成——Stable Diffusion项目记录

 

目录

 效果:

引言

实验设置

实验结果

结果分析

1. 基础模型 vs. ControlNet边缘图优化

2. 颜色因子对生成效果的影响

颜色因子为0.3、0.4、0.5的实验

颜色因子为0.6、0.7的实验

3. 颜色因子调节的建议

结论


 效果:

从上到下的顺序依次是:
单controlnet边缘图结果、融合controlnet颜色因子0.9、0.7、0.5、0.3、原图

引言

在图像生成任务中,如何在保证生成质量的同时增加多样性与细节,始终是研究的热点之一。ControlNet作为一种强大的条件控制工具,通过提供边缘图、颜色图等先验信息,能够引导扩散模型(Diffusion Model)生成更符合预期的图像。本文将基于近期的实验,定量对比ControlNet结合边缘图与颜色图(通过设置不同颜色因子)对生成效果的影响,并分析实验结果。

实验设置

本次实验基于扩散模型,结合ControlNet进行条件控制。实验涉及以下几组:

  1. generated_pic:基础扩散模型生成图像,未使用ControlNet。

  2. generated_pic_controlnet:使用Canny边缘图优化的ControlNet生成图像。

  3. generated_pic_contronet_2_color0.3:ControlNet融合Canny边缘图与颜色图,颜色因子为0.3。

  4. generated_pic_contronet_2_color0.4:ControlNet融合Canny边缘图与颜色图,颜色因子为0.4。

  5. generated_pic_contronet_2_color0.5:ControlNet融合Canny边缘图与颜色图,颜色因子为0.5。

  6. generated_pic_contronet_2_color0.6:ControlNet融合Canny边缘图与颜色图,颜色因子为0.6。

  7. generated_pic_contronet_2_color0.7:ControlNet融合Canny边缘图与颜色图,颜色因子为0.7。

评估指标:PSNR(峰值信噪比)、SSIM(结构相似性)和LPIPS(学习感知图像块相似性)分别用来衡量图像的像素精度、结构一致性和感知质量。

实验结果
 

 

以下是各实验组的平均指标结果:

 整理为表格

实验组 PSNR↑ SSIM↑ LPIPS↓
generated_pic 6.98 0.3648 0.6856
generated_pic_controlnet 8.44 0.6434 0.2713
generated_pic_contronet_2_color0.3 8.16 0.5901 0.3464
generated_pic_contronet_2_color0.4 8.12 0.5754 0.3524
generated_pic_contronet_2_color0.5 8.60 0.6407 0.3004
generated_pic_contronet_2_color0.6 7.80 0.5338 0.4070
generated_pic_contronet_2_color0.7 7.94 0.5523 0.3614

结果分析

1. 基础模型 vs. ControlNet边缘图优化
  • ControlNet相比基础模型generated_pic,PSNR从6.98提升至8.44,SSIM从0.3648跃升至0.6434,LPIPS从0.6856大幅下降至0.2713。这表明边缘图作为先验信息,能够显著提升图像的生成质量,尤其在像素精度和结构一致性上。

2. 颜色因子对生成效果的影响
颜色因子为0.3、0.4、0.5的实验
  • 颜色因子为0.3(生成图像:generated_pic_contronet_2_color0.3):PSNR为8.16,接近ControlNet的8.44,SSIM为0.5901,LPIPS为0.3464,表明较小的颜色因子略微保留了结构信息,但仍能引入一定的颜色细节

  • 颜色因子为0.4(生成图像:generated_pic_contronet_2_color0.4):PSNR略有下降至8.12,SSIM进一步下降至0.5754,LPIPS为0.3524,显示出颜色信息的增加略微影响了结构一致性和感知质量

  • 颜色因子为0.5(生成图像:generated_pic_contronet_2_color0.5):PSNR达到8.60,为所有实验组中的最高值,SSIM为0.6407,LPIPS为0.3004,综合表现最优。表明此因子能够平衡颜色信息和结构信息,提升生成图像的整体质量。

颜色因子为0.6、0.7的实验
  • 颜色因子为0.6(生成图像:generated_pic_contronet_2_color0.6):PSNR下降至7.80,SSIM降至0.5338,LPIPS升高至0.4070,表明更大的颜色因子开始过度影响结构信息,导致图像质量下降。

  • 颜色因子为0.7(生成图像:generated_pic_contronet_2_color0.7):PSNR进一步下降至7.94,SSIM为0.5523,LPIPS降至0.3614,显示出大幅增加的颜色信息已严重干扰生成图像的结构保真度。

3. 颜色因子调节的建议

从实验结果看,颜色因子0.5的效果是最优的。虽然较小的因子(如0.3和0.4)可以保留更多的边缘信息,但不会对图像质量带来显著提升。随着因子的增大(如0.6和0.7),颜色信息的影响开始超过边缘图的约束,导致生成质量下降。因此,可以推测,颜色因子在0.5附近可能是最理想的值进一步的实验可在0.45、0.55等区间进行微调,寻求更精细的平衡

结论

本次实验表明,ControlNet结合Canny边缘图和适度的颜色图能够显著提升图像生成质量,特别是在PSNR和SSIM指标上,效果尤为明显。最理想的颜色因子为0.5,这个因子在保留边缘信息的同时,成功引入了适当的颜色细节,达到了最优的生成效果。

未来的工作可以进一步探索不同颜色因子的细致调节,以及引入更多类型的先验信息(如纹理图、深度图等),以期进一步提升扩散模型在图像生成中的能力。
 

 这篇是实验指标结果(二):对(一)推理的验证,包含颜色因子为0.3、0.4、0.5、0.6、0.7,。以前的基础部署及优化过程:
深度学习项目记录·Stable Diffusion从零搭建、复现笔记-CSDN博客
从全灰到清晰图像:我的 Stable Diffusion 多尺度优化学习记录-CSDN博客

 【优化记录】不更换模型,提升Stable Diffusion人体细节效果的全流程-CSDN博客Stable Diffusion+Pyqt5: 实现图像生成与管理界面(带保存 + 历史记录 + 删除功能)——我的实验记录(结尾附系统效果图)-CSDN博客Stable Diffusion + Contronet,调参实现LPIPS最优(带生成效果+指标对比)——项目学习记录-CSDN博客SD + Contronet,扩散模型V1.5+约束条件后续优化:保存Canny边缘图,便于视觉理解——stable diffusion项目学习笔记-CSDN博客

Stable Diffusion +双Contronet:从 ControlNet 边缘图到双条件融合:实现服装图像生成的技术演进——项目学习记录-CSDN博客

SD+融合ControlNet,扩散模型V1.5+约束条件边缘图+颜色图实现服装图像生成:定量对比试验结果+分析-CSDN博客

文章来源于互联网:SD+ ControlNet (边缘图+颜色图),扩散模型+约束条件关于颜色因子的探索实验(二)完结,实现服装图像生成——Stable Diffusion项目记录

相关推荐: stable-diffusion-webui-amdgpu-forge:优化资源管理,加速推理

stable-diffusion-webui-amdgpu-forge:优化资源管理,加速推理 项目介绍 stable-diffusion-webui-amdgpu-forge 是一个基于 Stable Diffusion WebUI AMDGPU 的平台,旨…

赞(0)
未经允许不得转载:5bei.cn大模型教程网 » SD+ ControlNet (边缘图+颜色图),扩散模型+约束条件关于颜色因子的探索实验(二)完结,实现服装图像生成——Stable Diffusion项目记录
分享到: 更多 (0)

AI大模型,我们的未来

小欢软考联系我们