AI大模型教程
一起来学习

【AI学习】Stable Diffusion 3.5介绍原文+中文翻译

▌导读

2024年10月22日,Stability AI团队发布Stable Diffusion 3.5,该模型可免费用于商业或非商业用途。

本文是了解Stable Diffusion 3.5的学习笔记,供有需求的同学一起学习参考。


▌《Stable Diffusion 3.5介绍》-谷歌翻译版

Stable Diffusion 3.5介绍

时间:10 月 22 日

10 月 29 日更新,发布稳定版 Diffusion 3.5 Medium

关键要点:

  • 今天我们推出的是 Stable Diffusion 3.5。此开放版本包含多个模型变体,包括 Stable Diffusion 3.5 Large 和 Stable Diffusion 3.5 Large Turbo,以及自 10 月 29 日起推出的 Stable Diffusion 3.5 Medium。

  • 这些模型的尺寸可高度定制,可在消费级硬件上运行,并且根据宽松的Stability AI 社区许可,可免费用于商业和非商业用途。

  • 您现在可以从Hugging Face下载所有 Stable Diffusion 3.5 模型和GitHub上的推理代码。

今天,我们发布了 Stable Diffusion 3.5,这是我们迄今为止最强大的模型。此开放版本包含多个可定制的变体,可在消费级硬件上运行,并可在宽松的Stability AI 社区许可证下使用。您现在可以从Hugging Face下载 Stable Diffusion 3.5 Large 和 Stable Diffusion 3.5 Large Turbo 模型,并在 GitHub 上下载推理代码。

6 月,我们发布了 Stable Diffusion 3 Medium,这是 Stable Diffusion 3 系列的第一个开放版本。此版本没有完全满足我们的标准或社区的期望。在听取了宝贵的社区反馈后,我们没有采取快速修复措施,而是花时间进一步开发一个版本,以推进我们改造视觉媒体的使命。

Stable Diffusion 3.5 体现了我们致力于为开发者和创作者提供广泛可用、先进且在大多数情况下免费的工具的承诺。我们鼓励在整个流程中分发和货币化工作 – 无论是微调、LoRA、优化、应用程序还是艺术作品。

发布内容

Stable Diffusion 3.5 提供了多种模型,旨在满足科学研究人员、业余爱好者、初创企业和企业的需求:

  • Stable Diffusion 3.5 Large:该基础型号拥有 81 亿个参数,质量卓越,响应迅速,是 Stable Diffusion 系列中最强大的型号。该型号非常适合 1 百万像素分辨率的专业用例。

  • 稳定扩散 3.5 Large Turbo:稳定扩散 3.5 Large 的精简版仅需 4 个步骤即可生成高质量图像,且具有出色的快速依从性,速度比稳定扩散 3.5 Large 快得多。

  • Stable Diffusion 3.5 Medium:该模型拥有 25 亿个参数,采用改进的 MMDiT-X 架构和训练方法,可在消费级硬件上“开箱即用”,在质量和定制易用性之间取得平衡。它能够生成分辨率在 0.25 到 2 百万像素之间的图像。

开发模型

在开发模型时,我们优先考虑可定制性,以提供灵活的构建基础。为了实现这一点,我们将查询键规范化集成到转换器块中,稳定了模型训练过程并简化了进一步的微调和开发。

为了支持这种下游灵活性,我们必须做出一些权衡。使用不同种子的同一提示可能会产生更大的输出差异,这是有意为之,因为它有助于在基础模型中保留更广泛的知识库和多样化的风格。然而,结果,缺乏特异性的提示可能会导致输出的不确定性增加,并且美学水平可能会有所不同。

具体来说,对于 Medium 模型,我们对架构和训练协议进行了一些调整,以提高质量、连贯性和多分辨率生成能力。

模型的优势

Stable Diffusion 3.5 版本在以下方面表现出色,使其成为市场上最可定制、最易于访问的图像模型之一,同时在及时性和图像质量方面保持顶级性能:

  • 可定制性:轻松微调模型以满足您的特定创作需求,或根据定制的工作流程构建应用程序。

  • 高效性能:经过优化,可在标准消费硬件上运行,无需繁重工作,尤其是 Stable Diffusion 3.5 Medium 和 Stable Diffusion 3.5 Large Turbo 型号。

    我们查看了运行 Stable Diffusion 3.5 Medium 以及其他开放图像基础模型的硬件兼容性。此模型仅需要 9.9 GB 的 VRAM(不包括文本编码器)即可发挥其全部性能,使其高度可访问且与大多数消费级 GPU 兼容。

  • 多样化输出:创建代表世界的图像,而不仅仅是一种类型的人,具有不同的肤色和特征,无需大量提示。

  • 风格多样:能够生成各种风格和美感,如 3D、摄影、绘画、线条艺术以及几乎任何可以想象的视觉风格。

此外,我们的分析表明,Stable Diffusion 3.5 Large在及时遵守方面处于市场领先地位,并且在图像质量方面可与更大的型号相媲美。

Stable Diffusion 3.5 Large Turbo提供了同类模型中最快的推理时间,同时在图像质量和及时性方面保持了高度竞争力,即使与类似尺寸的非蒸馏模型相比也是如此

Stable Diffusion 3.5 Medium 的表现优于其他中型型号,在迅速遵守和图像质量之间实现了平衡,使其成为高效、高质量性能的首选。

Stability AI 社区许可证一览

我们很高兴根据我们的宽松社区许可证发布此模型。以下是许可证的关键组成部分:

  • 非商业用途免费:个人和组织可以免费将该模型用于非商业用途,包括科学研究。

  • 免费用于商业用途(年收入最高 100 万美元):初创企业、中小型企业和创作者可以免费将该模型用于商业用途,只要他们的年总收入低于 100 万美元。

  • 输出所有权:保留所产生的媒体的所有权,不受限制性许可的影响。

对于年收入超过 100 万美元的组织,请在此处联系我们,咨询企业许可证。

访问模型的更多方式

虽然模型权重现在可以在 Hugging Face 上自托管,但您也可以通过以下平台访问该模型:

  • 稳定性 AI API

  • 复制

  • DeepInfra

  • 舒适的用户界面

我们对安全的承诺

我们相信安全、负责任的 AI 实践,并采取深思熟虑的措施确保 Integrity 在开发早期阶段就已开始。这意味着我们已经采取并将继续采取合理措施,防止不良行为者滥用 Stable Diffusion 3.5。有关我们的安全方法的更多信息,请访问我们的Stable Safety页面。

▌内容来源

[1] Introducing Stable Diffusion 3.5 原文链接: https://stability.ai/news/introducing-stable-diffusion-3-5

关于AI绘画技术储备

学好 AI绘画 不论是就业还是做副业赚钱都不错,但要学会 AI绘画 还是要有一个学习规划。最后大家分享一份全套的 AI绘画 学习资料,给那些想学习 AI绘画 的小伙伴们一点帮助!

对于0基础小白入门:

如果你是零基础小白,想快速入门AI绘画是可以考虑的。

一方面是学习时间相对较短,学习内容更全面更集中。
二方面是可以找到适合自己的学习方案

包括:stable diffusion安装包、stable diffusion0基础入门全套PDF,视频学习教程。带你从零基础系统性的学好AI绘画!

零基础AI绘画学习资源介绍

👉stable diffusion新手0基础入门PDF👈

(全套教程文末领取哈)

👉AI绘画必备工具👈

温馨提示:篇幅有限,已打包文件夹,获取方式在:文末

👉AI绘画基础+速成+进阶使用教程👈

观看零基础学习视频,看视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。

温馨提示:篇幅有限,已打包文件夹,获取方式在:文末

👉12000+AI关键词大合集👈

这份完整版的AI绘画全套学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

文章来源于互联网:【AI学习】Stable Diffusion 3.5介绍原文+中文翻译

赞(0)
未经允许不得转载:5bei.cn大模型教程网 » 【AI学习】Stable Diffusion 3.5介绍原文+中文翻译
分享到: 更多 (0)

AI大模型,我们的未来

小欢软考联系我们