Stable Diffusion：使用自己的数据集微调训练LoRA模型（v2.0）

原创已于 2025-08-12 22:31:06 修改 · 1.5k 阅读

26 ·

本内容遵循CC 4.0 BY-SA版权协议

GEO检测

标签

#python #人工智能 #stable diffusion #大模型 #aigc

于 2025-08-12 22:27:23 首次发布

人工智能应用同时被 2 个专栏收录

59 篇文章

订阅专栏

AI大模型应用开发

5 篇文章

订阅专栏

该文章已生成可运行项目，

Stable Diffusion：使用自己的数据集微调训练LoRA模型（v2.0）

前言
环境要求
相关介绍
微调训练LoRA模型
参考

在这里插入图片描述

前言

由于本人水平有限，难免出现错漏，敬请批评改正。
更多精彩内容，可点击进入Python日常小操作专栏、OpenCV-Python小应用专栏、YOLO系列专栏、自然语言处理专栏、人工智能混合编程实践专栏或我的个人主页查看
人工智能混合编程实践：C++调用Python ONNX进行YOLOv8推理
人工智能混合编程实践：C++调用封装好的DLL进行YOLOv8实例分割
人工智能混合编程实践：C++调用Python ONNX进行图像超分重建
人工智能混合编程实践：C++调用Python AgentOCR进行文本识别
通过计算实例简单地理解PatchCore异常检测
Python将YOLO格式实例分割数据集转换为COCO格式实例分割数据集
YOLOv8 Ultralytics：使用Ultralytics框架训练RT-DETR实时目标检测模型
基于DETR的人脸伪装检测
YOLOv7训练自己的数据集（口罩检测）
YOLOv8训练自己的数据集（足球检测）
YOLOv5：TensorRT加速YOLOv5模型推理
YOLOv5：IoU、GIoU、DIoU、CIoU、EIoU
玩转Jetson Nano（五）：TensorRT加速YOLOv5目标检测
YOLOv5：添加SE、CBAM、CoordAtt、ECA注意力机制
YOLOv5：yolov5s.yaml配置文件解读、增加小目标检测层
Python将COCO格式实例分割数据集转换为YOLO格式实例分割数据集
YOLOv5：使用7.0版本训练自己的实例分割模型（车辆、行人、路标、车道线等实例分割）
使用Kaggle GPU资源免费体验Stable Diffusion开源项目
Stable Diffusion：在服务器上部署使用Stable Diffusion WebUI进行AI绘图（v2.0）
Stable Diffusion：使用自己的数据集微调训练LoRA模型（v2.0）

环境要求

Package                      Version            Editable project location
---------------------------- ------------------ ----------------------------------
Python                       3.10.18
absl-py                      2.3.1
accelerate                   0.25.0
aiofiles                     23.2.1
aiohappyeyeballs             2.6.1
aiohttp                      3.12.15
aiosignal                    1.4.0
albumentations               1.4.3
altair                       4.2.2
annotated-types              0.7.0
antlr4-python3-runtime       4.9.3
anyio                        4.9.0
appdirs                      1.4.4
astunparse                   1.6.3
async-timeout                5.0.1
attrs                        25.3.0
bitsandbytes                 0.43.0
certifi                      2025.7.14
charset-normalizer           3.4.2
click                        8.2.1
colorama                     0.4.6
coloredlogs                  15.0.1
contourpy                    1.3.2
controlnet_aux               0.0.10
cycler                       0.12.1
dadaptation                  3.1
diffusers                    0.25.0
docker-pycreds               0.4.0
easygui                      0.98.3
einops                       0.7.0
entrypoints                  0.4
exceptiongroup               1.3.0
fairscale                    0.4.13
fastapi                      0.112.4
ffmpy                        0.6.1
filelock                     3.18.0
flatbuffers                  25.2.10
fonttools                    4.59.0
frozenlist                   1.7.0
fsspec                       2025.7.0
ftfy                         6.1.1
gast                         0.6.0
gitdb                        4.0.12
GitPython                    3.1.45
google-pasta                 0.2.0
gradio                       4.44.1
gradio_client                1.3.0
grpcio                       1.74.0
h11                          0.16.0
h5py                         3.14.0
httpcore                     1.0.9
httpx                        0.28.1
huggingface-hub              0.20.1
humanfriendly                10.0
idna                         3.10
imagesize                    1.4.1
importlib_metadata           8.7.0
importlib_resources          6.5.2
invisible-watermark          0.2.0
Jinja2                       3.1.6
jsonschema                   4.25.0
jsonschema-specifications    2025.4.1
keras                        3.11.0
kiwisolver                   1.4.8
libclang                     18.1.1
library                      0.0.0              
lightning-utilities          0.15.0
lion-pytorch                 0.0.6
lycoris_lora                 2.2.0.post3
Markdown                     3.8.2
markdown-it-py               3.0.0
MarkupSafe                   2.1.5
matplotlib                   3.10.3
mdurl                        0.1.2
ml_dtypes                    0.5.3
mpmath                       1.3.0
multidict                    6.6.3
namex                        0.1.0
networkx                     3.4.2
numpy                        1.26.4
omegaconf                    2.3.0
onnx                         1.16.1
onnxruntime-gpu              1.17.1
open-clip-torch              2.20.0
opencv-python                4.7.0.68
opt_einsum                   3.4.0
optree                       0.17.0
orjson                       3.11.1
packaging                    25.0
pandas                       2.3.1
pathtools                    0.1.2
pillow                       10.4.0
pip                          25.1
prodigyopt                   1.0
propcache                    0.3.2
protobuf                     3.20.3
psutil                       7.0.0
pydantic                     2.10.6
pydantic_core                2.27.2
pydub                        0.25.1
Pygments                     2.19.2
pyparsing                    3.2.3
pyreadline3                  3.5.4
python-dateutil              2.9.0.post0
python-multipart             0.0.20
pytorch-lightning            1.9.0
pytz                         2025.2
PyWavelets                   1.8.0
PyYAML                       6.0.2
referencing                  0.36.2
regex                        2025.7.31
requests                     2.32.4
rich                         14.1.0
rpds-py                      0.26.0
ruff                         0.12.7
safetensors                  0.4.2
scipy                        1.11.4
semantic-version             2.10.0
sentencepiece                0.2.0
sentry-sdk                   2.34.0
setproctitle                 1.3.6
setuptools                   78.1.1
shellingham                  1.5.4
six                          1.17.0
smmap                        5.0.2
sniffio                      1.3.1
starlette                    0.38.6
sympy                        1.14.0
tensorboard                  2.19.0
tensorboard-data-server      0.7.2
tensorflow                   2.19.0
tensorflow-io-gcs-filesystem 0.31.0
termcolor                    3.1.0
timm                         0.6.12
tk                           0.1.0
tokenizers                   0.15.2
toml                         0.10.2
tomlkit                      0.12.0
toolz                        1.0.0
torch                        2.1.2+cu118
torchaudio                   2.1.2+cu118
torchmetrics                 1.8.0
torchvision                  0.16.2+cu118
tqdm                         4.67.1
transformers                 4.38.0
typer                        0.16.0
typing_extensions            4.14.1
typing-inspection            0.4.1
tzdata                       2025.2
urllib3                      2.5.0
uvicorn                      0.35.0
voluptuous                   0.13.1
wandb                        0.15.11
wcwidth                      0.2.13
websockets                   12.0
Werkzeug                     3.1.3
wheel                        0.45.1
wrapt                        1.17.2
xformers                     0.0.23.post1+cu118
yarl                         1.20.1
zipp                         3.23.0

微调训练LoRA模型

下载kohya_ss项目

官方源地址：https://github.com/bmaltais/kohya_ss.git

Windows

在这里插入图片描述下载解压后，项目目录，如下图所示。

Linux

git clone -b v24.1.7 https://github.com/bmaltais/kohya_ss.git
cd kohya_ss/

安装kohya_ss项目

打开终端并导航到所需的安装目录。
进入kohya_ss目录:

cd kohya_ss

执行如下命令运行setup脚本:

# CUDA 11.8
pip install torch==2.1.2 torchvision==0.16.2 torchaudio==2.1.2 --index-url https://download.pytorch.org/whl/cu118
pip install -r requirements_pytorch_windows.txt -i https://mirrors.aliyun.com/pypi/simple
pip install -r requirements_windows.txt 
pip install xformers==0.0.23.post1+cu118 --index-url https://download.pytorch.org/whl/cu118

pip install gradio_client -i https://mirrors.aliyun.com/pypi/simple --no-deps	
pip install httpx -i https://mirrors.aliyun.com/pypi/simple --no-deps
pip install tqdm -i https://mirrors.aliyun.com/pypi/simple --no-deps
pip install PyYAML -i https://mirrors.aliyun.com/pypi/simple
pip install gradio==4.44.1 -i https://mirrors.aliyun.com/pypi/simple
pip install pydantic==2.10.6 -i https://mirrors.aliyun.com/pypi/simple
pip install -e ./sd-scripts

如果没有报错，则安装成功。

运行kohya_ss项目

在Windows上，在终端中运行它，命令如下：

python kohya_gui.py --listen 127.0.0.1 --server_port 7860

在这里插入图片描述

运行成功后，可在浏览器输入http://127.0.0.1:7860/打开，如下图所示。
在这里插入图片描述

注：详细使用教程可查阅此项目中的README.md文件

准备数据集

在kohya_ss项目下，创建一个train目录，具体内容如下：
在这里插入图片描述

images : 训练图片和对应的TXT标注文件所在文件夹。
logs：保存训练记录的文件夹
models：模型保存路径
images目录还有一个子目录，比如本文这里是50_Anime，50表示50个steps，会直接影响训练的步数和效果，Anime表示图片相关主题描述。

微调参数设置

本文预训练模型使用的是v1-5-pruned-emaonly.safetensors

开始训练LoRA模型

在这里插入图片描述

训练完成后，会在models文件夹里生成一个.safetensors模型文件
在这里插入图片描述

TensorBoard查看训练情况

在页面上，点击Start TensorBoard，打开网址http://127.0.0.1:6006，即可查看。

在这里插入图片描述

测试训练的LoRA模型

测试模型，需要使用到Stable Diffusion WebUI项目，具体安装方法，可查阅Stable Diffusion：在服务器上部署使用Stable Diffusion WebUI进行AI绘图（v2.0）

将kohya_ss/train/20250812/models目录里的Anime_bs1_epoch50_fp16.safetensors模型文件分别拷贝到stable-diffusion-webui项目里的stable-diffusion-webui/models/Lora目录下。

在这里插入图片描述

在stable-diffusion-webui目录下，使用命令在终端中运行它，命令如下：

python launch.py --listen --enable-insecure-extension-access --port 7860

在这里插入图片描述

运行成功后，可在浏览器输入http://127.0.0.1:7860/打开，如下图所示。
在这里插入图片描述

使用自己训练的LoRA模型

文生图（txt2img）

 <lora:Anime_bs1_epoch50_fp16.safetensors:1>1boy, bandages, black background, black jacket, blue eyes, gojou satoru, hand up, jacket, jujutsu kaisen, looking at viewer, male focus, parted lips, s0311 tre, short hair, simple background, solo, twitter username, upper body, white hair, wind

在这里插入图片描述

参考

[1] https://github.com/bmaltais/kohya_ss.git
[2] https://github.com/AUTOMATIC1111/stable-diffusion-webui
[3] https://github.com/camenduru/stable-diffusion-webui
[4] https://www.kaggle.com/code/camenduru/stable-diffusion-webui-kaggle
[5] https://blog.csdn.net/wpgdream/article/details/130607099
[6] https://zhuanlan.zhihu.com/p/620583928

由于本人水平有限，难免出现错漏，敬请批评改正。
更多精彩内容，可点击进入Python日常小操作专栏、OpenCV-Python小应用专栏、YOLO系列专栏、自然语言处理专栏、人工智能混合编程实践专栏或我的个人主页查看
人工智能混合编程实践：C++调用Python ONNX进行YOLOv8推理
人工智能混合编程实践：C++调用封装好的DLL进行YOLOv8实例分割
人工智能混合编程实践：C++调用Python ONNX进行图像超分重建
人工智能混合编程实践：C++调用Python AgentOCR进行文本识别
通过计算实例简单地理解PatchCore异常检测
Python将YOLO格式实例分割数据集转换为COCO格式实例分割数据集
YOLOv8 Ultralytics：使用Ultralytics框架训练RT-DETR实时目标检测模型
基于DETR的人脸伪装检测
YOLOv7训练自己的数据集（口罩检测）
YOLOv8训练自己的数据集（足球检测）
YOLOv5：TensorRT加速YOLOv5模型推理
YOLOv5：IoU、GIoU、DIoU、CIoU、EIoU
玩转Jetson Nano（五）：TensorRT加速YOLOv5目标检测
YOLOv5：添加SE、CBAM、CoordAtt、ECA注意力机制
YOLOv5：yolov5s.yaml配置文件解读、增加小目标检测层
Python将COCO格式实例分割数据集转换为YOLO格式实例分割数据集
YOLOv5：使用7.0版本训练自己的实例分割模型（车辆、行人、路标、车道线等实例分割）
使用Kaggle GPU资源免费体验Stable Diffusion开源项目
Stable Diffusion：在服务器上部署使用Stable Diffusion WebUI进行AI绘图（v2.0）
Stable Diffusion：使用自己的数据集微调训练LoRA模型（v2.0）