AI大模型教程
一起来学习

树环水印改版——Robust Image Watermarking using Stable Diffusion测试

论文:Robust Image Watermarking using Stable Diffusion

总结论文亮点是提出了一个可训练的潜变量ZT,这个潜变量一开始是由原始图像经过DDIM Inversion产生,然后加水印,之后经过N次的迭代训练输出一个与原始图像尽可能相同的潜变量,用这个潜变量经过Stable Diffusion生成的带水印图像此时与原始图像类似,最后与原始图像自适应相加。

论文与树环水印主要有两个区别:一是树环水印的初始潜变量是用rand方法随机生成的,然后使用提示词生成与原始图像相似的图像;而本论文的初始潜变量是用DDIM Inversion生成的,而且这个潜变量还可以训练。

第二个区别是树环水印提出了三种水印模式,zero、rand和ring,分布嵌入的是二进制0、随机高斯分布、恒定高斯分布(个人理解)。而本论文嵌入的水印只是随机高斯分布,相当于树环的rand水印,而rand水印在之前的博客中说过它抵抗旋转攻击很弱,而其它两种比较强,所以本文的水印如果能改成其它两种水印模式,应该能够抵抗旋转攻击。

测试结果1博主测试了两张图像,config是:嵌入单水印、嵌入到图像3通道、使用SD-2.1模型。每组的第一张图是输入的原始图像,可以看到在第一个迭代(iters)中,生成的图像是非常随机的,即使使用了DDIM Inversion也是如此。在经过多次迭代的训练后,潜变量逐渐与原始图像近似,所以生成的图像逐渐与原始图像相似,但最终结果还是与原始图像在色彩上有差异。

       以上图像是水印嵌入在RGB三通道的结果,色彩上与原图有较大差异,但如果嵌入在单通道的话可以看到色彩基本与原图相似(见下图)。所以还是嵌入单通道水印的结果图更好,但是对应的鲁棒性就会降低。

         

测试结果2论文也提供了使用prompt生成图像的方法,相当于图生图。从下图可以看到有prompt的情况下初始潜变量的训练就可有可无了。

                         

测试结果3博主分别测试了水印嵌入在单通道和三通道时的鲁棒性,可以看到嵌入在三通道时水印鲁棒性明显比单通道好。两种嵌入方式对于旋转攻击抵抗效果均较差,博主感觉换种水印类型应该能好点,参考树环的其它两种水印。

 

知识补充1:什么是Watson-VGG perceptual loss

在论文的loss设计中,作者使用了这个感知损失,Watson-VGG perceptual loss 是一种用于衡量图像感知质量的损失函数,它基于人类视觉感知的原理,尤其关注图像的视觉内容。这种损失函数用于评估图像重建或图像转换任务中生成图像的质量。

知识补充2:什么是图像去噪攻击BM3D

读的论文较少,这个攻击我第一次遇到,BM3D是芬兰Tampere工业大学在2007年发表的论文里提出的算法,作为一种效果较好的图像去噪攻击。论文中利用了图像去噪的原理来尝试移除或削弱图像中的水印。

文章来源于互联网:树环水印改版——Robust Image Watermarking using Stable Diffusion测试

相关推荐: ai智能写作用哪个软件?母亲节写作神器推荐

AI技术已经渗透到我们生活的方方面面,包括ai写作。 母亲节即将到来,许多学生都想撰写一些祝福语来表达对母亲的感激之情。幸运的是,有一些AI写作软件可以提供帮助,它们不仅能够提供写作灵感,还能帮助提升文章的质量。 下面,就让我们一起来看看这六款AI写作官网软件…

赞(0)
未经允许不得转载:5bei.cn大模型教程网 » 树环水印改版——Robust Image Watermarking using Stable Diffusion测试
分享到: 更多 (0)

AI大模型,我们的未来

小欢软考联系我们