【AI学习】Stable Diffusion 3.5介绍原文+中文翻译

今天我们推出的是 Stable Diffusion 3.5。此开放版本包含多个模型变体，包括 Stable Diffusion 3.5 Large 和 Stable Diffusion 3.5 Large Turbo，以及自 10 月 29 日起推出的 Stable Diffusion 3.5 Medium。
这些模型的尺寸可高度定制，可在消费级硬件上运行，并且根据宽松的Stability AI 社区许可，可免费用于商业和非商业用途。
您现在可以从Hugging Face下载所有 Stable Diffusion 3.5 模型和GitHub上的推理代码。

今天，我们发布了 Stable Diffusion 3.5，这是我们迄今为止最强大的模型。此开放版本包含多个可定制的变体，可在消费级硬件上运行，并可在宽松的Stability AI 社区许可证下使用。您现在可以从Hugging Face下载 Stable Diffusion 3.5 Large 和 Stable Diffusion 3.5 Large Turbo 模型，并在 GitHub 上下载推理代码。

6 月，我们发布了 Stable Diffusion 3 Medium，这是 Stable Diffusion 3 系列的第一个开放版本。此版本没有完全满足我们的标准或社区的期望。在听取了宝贵的社区反馈后，我们没有采取快速修复措施，而是花时间进一步开发一个版本，以推进我们改造视觉媒体的使命。

Stable Diffusion 3.5 体现了我们致力于为开发者和创作者提供广泛可用、先进且在大多数情况下免费的工具的承诺。我们鼓励在整个流程中分发和货币化工作 – 无论是微调、LoRA、优化、应用程序还是艺术作品。

发布内容

Stable Diffusion 3.5 提供了多种模型，旨在满足科学研究人员、业余爱好者、初创企业和企业的需求：

Stable Diffusion 3.5 Large：该基础型号拥有 81 亿个参数，质量卓越，响应迅速，是 Stable Diffusion 系列中最强大的型号。该型号非常适合 1 百万像素分辨率的专业用例。
稳定扩散 3.5 Large Turbo：稳定扩散 3.5 Large 的精简版仅需 4 个步骤即可生成高质量图像，且具有出色的快速依从性，速度比稳定扩散 3.5 Large 快得多。
Stable Diffusion 3.5 Medium：该模型拥有 25 亿个参数，采用改进的 MMDiT-X 架构和训练方法，可在消费级硬件上“开箱即用”，在质量和定制易用性之间取得平衡。它能够生成分辨率在 0.25 到 2 百万像素之间的图像。

开发模型

在开发模型时，我们优先考虑可定制性，以提供灵活的构建基础。为了实现这一点，我们将查询键规范化集成到转换器块中，稳定了模型训练过程并简化了进一步的微调和开发。

为了支持这种下游灵活性，我们必须做出一些权衡。使用不同种子的同一提示可能会产生更大的输出差异，这是有意为之，因为它有助于在基础模型中保留更广泛的知识库和多样化的风格。然而，结果，缺乏特异性的提示可能会导致输出的不确定性增加，并且美学水平可能会有所不同。

具体来说，对于 Medium 模型，我们对架构和训练协议进行了一些调整，以提高质量、连贯性和多分辨率生成能力。

模型的优势

Stable Diffusion 3.5 版本在以下方面表现出色，使其成为市场上最可定制、最易于访问的图像模型之一，同时在及时性和图像质量方面保持顶级性能：

可定制性：轻松微调模型以满足您的特定创作需求，或根据定制的工作流程构建应用程序。
高效性能：经过优化，可在标准消费硬件上运行，无需繁重工作，尤其是 Stable Diffusion 3.5 Medium 和 Stable Diffusion 3.5 Large Turbo 型号。

我们查看了运行 Stable Diffusion 3.5 Medium 以及其他开放图像基础模型的硬件兼容性。此模型仅需要 9.9 GB 的 VRAM（不包括文本编码器）即可发挥其全部性能，使其高度可访问且与大多数消费级 GPU 兼容。

多样化输出：创建代表世界的图像，而不仅仅是一种类型的人，具有不同的肤色和特征，无需大量提示。

风格多样：能够生成各种风格和美感，如 3D、摄影、绘画、线条艺术以及几乎任何可以想象的视觉风格。

此外，我们的分析表明，Stable Diffusion 3.5 Large在及时遵守方面处于市场领先地位，并且在图像质量方面可与更大的型号相媲美。

Stable Diffusion 3.5 Large Turbo提供了同类模型中最快的推理时间，同时在图像质量和及时性方面保持了高度竞争力，即使与类似尺寸的非蒸馏模型相比也是如此

Stable Diffusion 3.5 Medium 的表现优于其他中型型号，在迅速遵守和图像质量之间实现了平衡，使其成为高效、高质量性能的首选。

Stability AI 社区许可证一览

我们很高兴根据我们的宽松社区许可证发布此模型。以下是许可证的关键组成部分：

非商业用途免费：个人和组织可以免费将该模型用于非商业用途，包括科学研究。
免费用于商业用途（年收入最高 100 万美元）：初创企业、中小型企业和创作者可以免费将该模型用于商业用途，只要他们的年总收入低于 100 万美元。
输出所有权：保留所产生的媒体的所有权，不受限制性许可的影响。

对于年收入超过 100 万美元的组织，请在此处联系我们，咨询企业许可证。

访问模型的更多方式

虽然模型权重现在可以在 Hugging Face 上自托管，但您也可以通过以下平台访问该模型：

稳定性 AI API
复制
DeepInfra
舒适的用户界面

我们对安全的承诺

我们相信安全、负责任的 AI 实践，并采取深思熟虑的措施确保 Integrity 在开发早期阶段就已开始。这意味着我们已经采取并将继续采取合理措施，防止不良行为者滥用 Stable Diffusion 3.5。有关我们的安全方法的更多信息，请访问我们的Stable Safety页面。

▌内容来源

[1] Introducing Stable Diffusion 3.5 原文链接： https://stability.ai/news/introducing-stable-diffusion-3-5

关于AI绘画技术储备

学好 AI绘画不论是就业还是做副业赚钱都不错，但要学会 AI绘画还是要有一个学习规划。最后大家分享一份全套的 AI绘画学习资料，给那些想学习 AI绘画的小伙伴们一点帮助！

对于0基础小白入门：

如果你是零基础小白，想快速入门AI绘画是可以考虑的。

一方面是学习时间相对较短，学习内容更全面更集中。
二方面是可以找到适合自己的学习方案

包括：stable diffusion安装包、stable diffusion0基础入门全套PDF，视频学习教程。带你从零基础系统性的学好AI绘画！

零基础AI绘画学习资源介绍

👉stable diffusion新手0基础入门PDF👈

（全套教程文末领取哈）

👉AI绘画必备工具👈

温馨提示：篇幅有限，已打包文件夹，获取方式在：文末

👉AI绘画基础+速成+进阶使用教程👈

观看零基础学习视频，看视频学习是最快捷也是最有效果的方式，跟着视频中老师的思路，从基础到深入，还是很容易入门的。

温馨提示：篇幅有限，已打包文件夹，获取方式在：文末

👉12000+AI关键词大合集👈

这份完整版的AI绘画全套学习资料已经上传CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【`保证100%免费`】

文章来源于互联网:【AI学习】Stable Diffusion 3.5介绍原文+中文翻译

【AI学习】Stable Diffusion 3.5介绍原文+中文翻译

▌导读

▌《Stable Diffusion 3.5介绍》-谷歌翻译版

Stable Diffusion 3.5介绍

▌内容来源

关于AI绘画技术储备

零基础AI绘画学习资源介绍

👉stable diffusion新手0基础入门PDF👈

👉AI绘画必备工具👈

👉AI绘画基础+速成+进阶使用教程👈

👉12000+AI关键词大合集👈

这份完整版的AI绘画全套学习资料已经上传CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【`保证100%免费`】

相关推荐

对比kimi、通义千问、文心一言的写代码能力

热门文章

AI大模型,我们的未来