STLG_03_02_Stable Diffusion入门

Windows：
1. 右键点击“此电脑”或“计算机”，选择“属性”。
2. 点击“高级系统设置”。
3. 在“系统属性”窗口中，点击“环境变量”。
4. 在“系统变量”部分，找到Path变量，点击“编辑”。
5. 添加CUDA的安装路径，通常是C:Program FilesNVIDIA GPU Computing ToolkitCUDAvXX.Xbin。
Linux：

在终端输入以下命令将CUDA路径添加到PATH环境变量中：
```
export PATH=/usr/local/cuda-XX.X/bin:/usr/local/cuda-XX.X/lib64:$PATH
```
其中XX.X是你的CUDA版本号。
macOS：

安装CUDA for macOS，具体步骤可以参考NVIDIA官方文档。

1.4 安装Anaconda（可选）

Anaconda是一个开源的Python和R语言的发行版，包含了包管理和环境管理的功能。如果你更喜欢使用Anaconda来管理Python环境，可以下载并安装Anaconda。

2. 安装步骤

2.1 克隆Stable Diffusion仓库

使用Git克隆Stable Diffusion的源代码到本地：

git clone https://github.com/CompVis/stable-diffusion.git
cd stable-diffusion

2.2 创建虚拟环境

为了隔离依赖环境，建议使用虚拟环境来安装Stable Diffusion所需的Python包。

2.2.1 使用`venv`创建虚拟环境

创建虚拟环境：
```
python -m venv sd_env
```

激活虚拟环境：

Windows:
```
sd_envScriptsactivate
```
Linux/macOS:
```
source sd_env/bin/activate
```

安装依赖包：

在激活虚拟环境后，使用pip安装Stable Diffusion所需的依赖包：
```
pip install -r requirements.txt
```

2.2.2 使用Anaconda创建虚拟环境（可选）

如果你使用Anaconda，可以按照以下步骤创建和激活虚拟环境：

创建虚拟环境：
```
conda create -n sd_env python=3.8
```
激活虚拟环境：
```
conda activate sd_env
```
安装依赖包：
```
pip install -r requirements.txt
```

2.3 下载预训练模型

Stable Diffusion依赖于预训练模型来生成图像。你可以从Hugging Face或其他可信来源下载模型。

访问Hugging Face模型库下载sd-v1-4.ckpt模型文件。
将下载的模型文件放置在stable-diffusion/models/ldm/stable-diffusion-v1目录下。如果目录不存在，需要手动创建。

2.4 配置环境变量

为了确保模型能够正常加载，需要配置一些环境变量。

创建一个.env文件，并添加以下内容：
```
PYTORCH_CUDA_ALLOC_CONF=max_split_size_mb:256
```
这个配置有助于优化CUDA内存分配，减少内存碎片。
确保你的GPU驱动程序是最新的，并且CUDA版本与PyTorch兼容（推荐CUDA 11.3或更高版本）。

2.5 安装PyTorch

Stable Diffusion依赖于PyTorch框架。你需要根据你的GPU类型选择合适的PyTorch版本。

2.5.1 安装CUDA版本的PyTorch

如果你的计算机配备了NVIDIA GPU，并且已经安装了CUDA，可以安装CUDA版本的PyTorch，以利用GPU加速计算。

在命令行中输入以下命令安装PyTorch：

pip install torch torchvision torchaudio --extra-index-url https://download.pytorch.org/whl/cu113

2.5.2 安装CPU版本的PyTorch

如果你没有GPU，或者不希望使用GPU加速，可以安装CPU版本的PyTorch。

在命令行中输入以下命令安装PyTorch：

pip install torch torchvision torchaudio

请注意，CPU版本的性能远低于GPU版本，生成图像的时间会显著增加。

2.6 运行Stable Diffusion

一切准备就绪后，可以开始运行Stable Diffusion进行图像生成。

使用以下命令启动模型：
```
python scripts/txt2img.py --prompt "A fantasy landscape" --plms
```
这里的--prompt参数是你输入的文本描述，模型将根据这个描述生成相应的图像。--plms参数表示使用Piping’s Linear Multistep method进行采样，这通常会生成更高质量的图像。
生成的图像将保存在outputs/txt2img-samples目录下。你可以查看和分析这些图像，以评估模型的性能。

3. 常见问题与解决方案

3.1 CUDA错误

如果在运行过程中遇到CUDA错误，可能是因为你的GPU驱动程序版本与CUDA不兼容。

3.1.1 解决方案

更新NVIDIA驱动程序：

访问NVIDIA官网，下载并安装适用于你GPU型号的最新驱动程序。
检查CUDA版本：

确保你安装的CUDA版本与PyTorch兼容。可以在PyTorch官网的“Choose your installation”部分查看兼容性矩阵。
卸载并重新安装CUDA和PyTorch：

如果问题仍然存在，尝试卸载现有的CUDA和PyTorch，然后重新安装兼容的版本。

3.2 内存不足

如果你的GPU显存不足，可能会导致程序崩溃或运行缓慢。

3.2.1 解决方案

调整max_split_size_mb参数：

在.env文件中，尝试减小max_split_size_mb的值，例如设置为128或64：
```
PYTORCH_CUDA_ALLOC_CONF=max_split_size_mb:128
```
减少批量大小：

在脚本中，可以通过调整批量大小（batch size）来减少内存使用。例如，将批量大小从8减小到4。
使用较低分辨率：

降低生成图像的分辨率可以减少内存消耗。在脚本中，可以通过设置--H和--W参数来调整高度和宽度。
禁用某些功能：

如果模型中包含一些可选组件，尝试禁用它们以降低内存使用。

3.3 模型文件丢失或损坏

如果模型文件丢失或损坏，模型将无法加载。

3.3.1 解决方案

重新下载模型文件：

从Hugging Face模型库重新下载sd-v1-4.ckpt文件，并确保放置在正确的目录下。
检查文件完整性：

确认模型文件没有损坏，可以尝试重新下载或验证文件的MD5哈希值。

3.4 依赖包安装失败

在安装依赖包时，可能会遇到某些包安装失败的问题。

3.4.1 解决方案

检查网络连接：

确保你的网络连接正常，能够访问PyPI或其他依赖包的源。
使用镜像源：

如果你在中国大陆，可以尝试使用国内的PyPI镜像源，如清华镜像源：
```
pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple
```
手动安装依赖包：

如果某些包无法自动安装，可以尝试手动安装：
```
pip install 
```
更新pip：

确保你使用的是最新版本的pip：
```
pip install --upgrade pip
```

4. 高级配置与优化

4.1 使用GPU加速

为了充分利用GPU的性能，确保你的PyTorch安装了CUDA支持。在安装PyTorch时，选择与你的CUDA版本兼容的版本。

例如，如果你安装了CUDA 11.3，可以使用以下命令安装PyTorch：

pip install torch torchvision torchaudio --extra-index-url https://download.pytorch.org/whl/cu113

4.2 多GPU支持

如果你的机器有多块GPU，可以通过配置来启用多GPU支持，以加快生成速度。

修改脚本：

在txt2img.py脚本中，添加--n_gpu参数来指定使用的GPU数量：
```
python scripts/txt2img.py --prompt "A fantasy landscape" --plms --n_gpu 2
```
数据并行：

确保模型支持数据并行，即能够在多个GPU之间分布计算。

4.3 自定义模型

你也可以基于Stable Diffusion进行进一步的训练和微调，生成符合自己需求的模型。具体步骤可以参考官方文档中的训练指南。

准备训练数据：

收集并整理用于训练的数据集。
修改训练脚本：

根据需求修改训练脚本，设置超参数等。
启动训练过程：

运行训练脚本，开始训练模型。
评估与调整：

定期评估模型的性能，并根据结果调整训练策略。

5. 总结

通过本文的详细步骤，应该可以成功在本地环境中安装并配置Stable Diffusion。接下来可以尝试生成不同风格的图像，并根据自己的需求进行进一步的优化和定制。Stable Diffusion的强大功能将为你在图像生成领域提供无限可能。

文章来源于互联网:STLG_03_02_Stable Diffusion入门 – 安装与配置

相关推荐: 我们决定用50个关键词，来总结2024这AI狂奔的一年

往期卡兹克好文： 2024，在 AI 历史上，注定是个风起的一年。我一直在想，究竟怎么给这一年，做一个有用、有趣、还具有代表性的总结。直到两周前，我去深圳调研，跟@腾讯研究院的朋友一起吃了顿饭，在饭局上，我们聊起这个事，他们说，他们也要做，他们本身就想用 …

STLG_03_02_Stable Diffusion入门 – 安装与配置

1. 环境准备

1.1 安装Python

1.2 安装Git

1.3 安装CUDA（可选）