AI大模型教程
一起来学习

【Diffusion学习】【生成式AI】Stable Diffusion、DALL-E、Imagen 背後共同的套路


from: https://www.youtube.com/watch?v=JbfcAaBT66U&list=PLJV_el3uVTsNi7PgekEUFsyVllAJXRsP-&index=5

简介:

84,841次观看 2023年3月25日 【機器學習 2023】(生成式 AI)
感謝黃敬峰先生提供字幕

Stable Diffusion
https://arxiv.org/abs/2112.10752

DALL-E series
https://arxiv.org/abs/2204.06125
https://arxiv.org/abs/2102.12092

Imagen
https://arxiv.org/abs/2205.11487


图片生成Framework 需要3个组件:

  1. Text Encoder
  2. Generation Model
  3. Decoder

相关论文【Stable Diffusion,DALL-E,Imagen】


具体介绍三个组件

1. Text encoder介绍【结论:文字的encoder重要,Diffusion的模型不是很重要!】

评估指标:FID计算

CLIP Score 计算

3. Decoder介绍【不需要成对的训练资料】


2. Diffusion Model介绍【训练一个noise predicter】

noise 加在 latent representation上


文章来源于互联网:【Diffusion学习】【生成式AI】Stable Diffusion、DALL-E、Imagen 背後共同的套路

赞(0)
未经允许不得转载:5bei.cn大模型教程网 » 【Diffusion学习】【生成式AI】Stable Diffusion、DALL-E、Imagen 背後共同的套路
分享到: 更多 (0)

AI大模型,我们的未来

小欢软考联系我们