AI大模型教程
一起来学习

从零搭建 Stable Diffusion 图片生成模型——Colab 流程(新手也能学会)

目录

从零搭建 Stable Diffusion 文生图 Colab 流程

1. 准备环境(安装必要依赖)

作用:

操作代码:

2. 登录 Hugging Face(获取模型权限)

作用:

操作步骤:

第一次使用时:

操作代码:

3. 加载模型(Stable Diffusion v1.5)

作用:

操作代码:

4. 文生图(输入提示词生成图像)

作用:

操作代码:

注意:

5. (可选)保存图像到本地

作用:

6. 可调节参数(提升控制力)

整体流程结构图

示例 Prompt 提示词推荐

结语


从零搭建 Stable Diffusion 文生图 Colab 流程


1. 准备环境(安装必要依赖)

作用:

Stable Diffusion 依赖 Hugging Face 的 diffusers 库,以及 transformersacceleratesafetensors 等。第一步先装好这些。

操作代码:

# 安装 Hugging Face 的 diffusers 工具包和其他依赖
!pip install diffusers transformers accelerate scipy safetensors --upgrade

2. 登录 Hugging Face(获取模型权限)

作用:

Stable Diffusion 模型发布在 Hugging Face 上。使用时需要登录你的 Hugging Face 账户,以授权加载模型。

操作步骤:

第一次使用时:
  1. https://huggingface.co 注册账号

  2. 打开这个链接生成访问令牌(Access Token):
    https://huggingface.co/settings/tokens
    建议选择“Read”权限即可。

操作代码:

from huggingface_hub import login

# 这里填入你自己的 token(复制粘贴,不用加引号)
login("hf_xxxxxxxx你的Token")

3. 加载模型(Stable Diffusion v1.5)

作用:

我们加载 runwayml/stable-diffusion-v1-5 版本,这是最常用且稳定的模型。

操作代码:

from diffusers import StableDiffusionPipeline
import torch

# 正确方式:不指定 revision,用 default 主分支
pipe = StableDiffusionPipeline.from_pretrained(
    "runwayml/stable-diffusion-v1-5",
    torch_dtype=torch.float16,  # 使用 float16,节省显存
    use_safetensors=True        # 推荐启用
).to("cuda")

 


4. 文生图(输入提示词生成图像)

作用:

你只需要输入一句 prompt,模型会根据这句话生成一张图像。

操作代码:

from IPython.display import display

# 霓虹闪烁的动漫风格赛博朋克城市夜晚
prompt = "a cyberpunk city at night with neon lights, anime style"

# guidance_scale 控制“提示词的强度”,越高越接近 prompt
image = pipe(prompt, guidance_scale=7.5).images[0]

# 展示图像
display(image)

 

 

注意:

这里不要使用中文,因为模型根本不支持中文的输入进行推理,如果使用中文,模型大概率会生成一些奇奇怪怪的东西。

下面的同一个意思中英文的不同效果。

 

 


5. (可选)保存图像到本地

作用:

将生成的图像保存为文件,可以下载。

image.save("output.png")

你可以点击左侧文件夹按钮找到 output.png,右键下载。


6. 可调节参数(提升控制力)

参数 作用 推荐值
prompt 输入的描述性文字 任意英文句子
guidance_scale 提示词强度,越高越受 prompt 影响 7~12
num_inference_steps 推理步数,越高越清晰,但越慢 25~50
height, width 图像尺寸(默认512×512) 比如 512×768 适合横图

示例(调整步数和尺寸):

image = pipe(prompt, guidance_scale=8.5, num_inference_steps=40, height=512, width=768).images[0]
image.show()

整体流程结构图

📦 安装依赖
  ↓
🔐 Hugging Face 登录认证
  ↓
🧠 加载 Stable Diffusion 模型
  ↓
📝 输入 Prompt 提示词
  ↓
🎨 模型生成图像
  ↓
💾 显示 / 保存结果

示例 Prompt 提示词推荐

你可以输入任意英文描述(中文也行但效果不稳定),以下是一些灵感:

中文想法 英文 prompt 示例
赛博朋克风的南京 “a cyberpunk night view of Nanjing, neon lights, futuristic”
汉服少女樱花树下自拍 “a girl in hanfu taking a selfie under cherry blossom trees, digital painting”
火星上弹吉他的宇航员 “an astronaut playing guitar on Mars, cinematic style”

结语

你现在已经完全掌握了从 0 开始在 Colab 上运行 Stable Diffusion 的所有流程了,不再是“照着点按钮”,而是:

  • 知道每一步干啥

  • 知道怎么调参数

  • 可以随心换模型、prompt、画风

文章来源于互联网:从零搭建 Stable Diffusion 图片生成模型——Colab 流程(新手也能学会)

相关推荐: 《Stable Diffusion v2-1-base模型的版本更新与新特性》

《Stable Diffusion v2-1-base模型的版本更新与新特性》 stable-diffusion-2-1-base 项目地址: https://gitcode.com/hf_mirrors/ai-gitcode/stable-diffusion…

赞(0)
未经允许不得转载:5bei.cn大模型教程网 » 从零搭建 Stable Diffusion 图片生成模型——Colab 流程(新手也能学会)
分享到: 更多 (0)

AI大模型,我们的未来

小欢软考联系我们