【LoRA模型训练】Stable Diffusion LoRA 模型秋叶训练器详细教程

硬件配置：
- NVIDIA 显卡（显存≥6GB，推荐 8GB 以上，SDXL 训练需 16GB+）
- 内存≥16GB，建议 32GB（避免数据加载卡顿）
- 存储空间≥50GB（含基础模型和训练数据）
软件环境：
- Windows 10/11（推荐）或 Linux（需手动配置依赖）
- Python 3.10.x（必须，安装时勾选 “Add Python to PATH”）
- Git（用于自动更新）

1.3 安装步骤

下载整合包
从官方 GitHub 仓库获取最新版本：

bash

git clone --recurse-submodules https://github.com/Akegarasu/lora-scripts

国内用户建议使用码云镜像：

bash

git clone https://gitee.com/Akegarasu/lora-scripts.git

环境初始化
- 解压至非中文路径（如D:lora-scripts）
- 双击运行A强制更新-国内加速.bat，自动安装依赖
- 若出现fbgemm.dll缺失错误，需下载依赖文件并复制到torch/lib目录（参考哔哩哔哩教程）
启动训练器
运行A启动脚本.bat，默认通过http://127.0.0.1:28000访问 Web 界面
- 首次启动会自动下载基础配置文件（约 200MB）
- 建议将启动脚本发送到桌面快捷方式

二、数据集准备全流程

2.1 素材收集与预处理

素材要求：
- 数量：人物 / 物体类 20-50 张，风格类 50-200 张
- 质量：分辨率≥512px，光照均匀，背景简洁，避免模糊 / 重复图像
- 多样性：人物需包含多角度（正面 / 侧面 / 45°）、多表情、多服饰
预处理工具：
- 批量裁剪：使用 Birme（https://www.birme.net）设置尺寸为 512×512（SD1.5）或 1024×1024（SDXL）
- 超分修复：通过 Stable Diffusion WebUI 的 “extras” 功能提升低清图像质量

2.2 标签生成与优化

自动打标
- 启动秋叶整合包的 WebUI，进入训练→图像预处理
- 源目录：原始图片文件夹，目标目录：输出路径
- 勾选自动焦点裁切和使用 Deepbooru 生成标签，点击 “预处理”
标签优化（关键步骤）
使用 BooruDatasetTagManager 工具：

bash
```
git clone https://github.com/starik222/BooruDatasetTagManager.git
cd BooruDatasetTagManager && pip install -r requirements.txt && python main.py
```
- 加载数据集：File→Load Folder 选择预处理后的图片目录
- 核心操作：
  - 删除冗余标签（如 “low quality” 等负面标签）
  - 置顶触发词（如 “mychar”），调整权重（靠前标签权重更高）
  - 统一标签格式（如 “1girl” 改为 “1girl, solo”）
- 保存更改：File→Save All Changes

2.3 数据集组织结构

严格遵循以下目录结构（以训练 “动漫角色” 为例）：

plaintext

lora-scripts/
└── train/
    └── anime_char/          # 主文件夹（自定义名称）
        └── 20_mychar/       # 格式：[repeat值]_[触发词]
            ├── img01.jpg     # 训练图片
            ├── img01.txt     # 对应标签文件
            ├── img02.jpg
            └── img02.txt

repeat 值设置：
- 素材
- 素材 50-100 张：设为 5-10
- 风格类数据集：设为 2-5

三、核心参数配置详解

3.1 基础配置参数

参数名称	含义说明	推荐值	注意事项
基础模型路径	选择预训练模型	ChilloutMix（写实）/AnythingV5（动漫）	需放入`sd-models`目录
数据集路径	训练素材存放目录	`./train/anime_char`	路径不可含中文 / 空格
输出路径	模型保存位置	`./output/mychar_202507`	按 “主题 + 日期” 命名便于管理
训练分辨率	图像尺寸（宽 × 高）	512×512（6GB 显存）/1024×1024（SDXL）	必须为 64 的倍数

3.2 训练控制参数

参数名称	含义说明	推荐值	调整技巧
网络维度（Network Dim）	控制模型复杂度	8-32（新手推荐 16）	简单物体 8-16，复杂角色 24-32
网络 Alpha	学习率缩放因子	与网络维度相同	loss 下降慢时降低为维度的 1/2
学习率	参数更新步长	文本编码器：1e-5；U-Net：1e-4	真人训练可降低至 5e-5
训练轮数（Epochs）	数据集迭代次数	10-20 轮	观察 loss 稳定后可提前停止
批处理大小（Batch Size）	单次训练图片数量	6GB 显存：1；12GB 显存：2-4	过大易导致显存溢出

3.3 优化器与调度器设置

优化器类型：
- AdamW8bit：默认选项，平衡显存与稳定性
- Lion8bit：训练速度提升 30%，适合大数据集
- Prodigy：自动调整学习率，需配合constant调度器
学习率调度器：
- cosine_with_restarts：复杂任务首选，重启次数≤4
- constant_with_warmup：新手友好，预热步数设为总步数 5%
- linear：适合需要精确控制学习率的场景

四、模型训练与监控

4.1 启动训练流程

模式选择：
- 新手模式：自动填充基础参数，适合首次使用
- 专家模式：可配置高级参数（如梯度检查点、混合精度）
关键配置步骤：
- 在 WebUI 中填写基础模型路径（如./sd-models/chilloutmix.safetensors）
- 设置训练数据集路径（如./train/anime_char）
- 勾选混合精度训练（FP16/BF16）和Latent 缓存（节省显存）
- 点击 “开始训练”，后台终端显示训练进度

4.2 训练过程监控

Loss 值分析：
- 理想曲线：稳定下降至 0.1-0.2 区间后趋于平稳
- 异常情况：
  - Loss>0.3 且不下降：检查标签质量或增大学习率
  - Loss 骤降至 0.05 以下：可能过拟合，减少训练轮数
TensorBoard 监控：
运行tensorboard.ps1，访问http://127.0.0.1:6006查看：
- 训练 Loss 曲线（train/loss）
- 学习率变化趋势（learning_rate）
- 生成样本对比（samples）

4.3 常见问题解决

问题现象	解决方案
显存不足（CUDA out of memory）	降低 Batch Size 至 1；启用梯度检查点；分辨率降至 512×512
训练中断后无法恢复	删除`output`目录下的`last.safetensors`；检查数据集路径是否正确
生成图像出现异常花纹	检查训练数据是否含相似纹理图片；降低网络维度至 8-16
torch 版本过低错误	运行`A强制更新-国内加速.bat`；手动安装 torch 2.3+：`pip install torch --upgrade`

五、模型测试与效果优化

5.1 基础测试流程

模型部署：
将训练生成的模型文件（如mychar.safetensors）复制到 SD WebUI 的models/Lora目录
生成测试：
- 正向提示词：masterpiece, best quality,

文章来源于互联网:【LoRA模型训练】Stable Diffusion LoRA 模型秋叶训练器详细教程

相关推荐: 系统掌握！Stable Diffusion 知识体系与 Lora 实战技巧解析

一、Lora是什么 LoRA，英文全称Low-Rank Adaptation of Large LanguageModels，直译为大[语言模型]的低阶适应，这是微软的研究人员为了解决大语言模型微调而开发的一项技术。 LoRA 是一种轻量级的 Stable-D…

【LoRA模型训练】Stable Diffusion LoRA 模型秋叶训练器详细教程

一、工具简介与安装指南

1.1 秋叶 LoRA 训练器概述

1.2 系统环境要求

1.3 安装步骤

二、数据集准备全流程

2.1 素材收集与预处理

2.2 标签生成与优化

2.3 数据集组织结构

三、核心参数配置详解

3.1 基础配置参数

3.2 训练控制参数

3.3 优化器与调度器设置

四、模型训练与监控

4.1 启动训练流程

4.2 训练过程监控

4.3 常见问题解决

五、模型测试与效果优化

5.1 基础测试流程

相关推荐

对比kimi、通义千问、文心一言的写代码能力

热门文章

AI大模型,我们的未来