使用lora-scripts在Linux上训练自己的AI绘画模型

梦璃雨落 发布于 2024-03-20 404 次阅读


AI 摘要

本文介绍了在Linux上使用lora-scripts训练自己的AI绘画模型的准备工作和步骤。需要具备适用的NVIDIA显卡、安装驱动和CUDA、基础环境、配置环境等,并提供了克隆代码、运行安装脚本、启动脚本、预处理、开始训练、使用模型等具体操作步骤。同时也提到了遇到的可能问题及解决方法,并简要介绍了如何在Tensorboard中查看训练信息和使用模型。

准备

需要一张显存大于6GNVIDA显卡,需要安装驱动CUDA,还有基础环境(gitpython3.10以上),相关步骤可在文章Debian Linux 安装 Stable Diffusion查看

下面是我的配置:Debian12,NVIDIA T4 x2(共32GB显存),256GB内存

服务器配置
如果使用国内环境,可能会遇到网络问题,需要自备代理

克隆代码

git clone --recurse-submodules https://github.com/Akegarasu/lora-scripts

运行安装脚本

chmod +x install.bash
./install.bash
运行安装脚本

脚本会自动创建虚拟环境和安装依赖,安装速度取决于网络环境(国内用户可以修改安装脚本,指定国内镜像源加快下载速度)

运行启动脚本

chmod +x run_gui.sh
source venv/bin/activate
./run_gui.sh --listen

由于我是服务器部署,所以需要添加--listen参数允许外部访问

如何你和我一样的使用debian12的纯净环境,可能会遇到ModuleNotFoundError: No module named 'tkinter'

报错

输入下面命令安装tkinter

apt-get install python3-tk

然后重启gui,当显示图示内容就启动成功

运行成功

然后浏览器输入服务器IP:28000就能打开webui

webui主界面

预处理

首先需要创建训练集,将需要喂的图片的图片缩放为5121024之间,在WD1.4标签器选项卡中,把图片的路径输入,点击启动,开始打标签。

第一次启动需要下载模型,需要良好的网络环境
打标签页面

开始训练

首先需要安装模型

LoRA选项卡中输入输入正确的路径和合适的参数,,点击开始训练,然后就可以开始漫长的等待了

提交任务
运行状态
GPU占用状态

Tensorboard中可以查看当前的训练信息

Tensorboard信息

使用模型

当训练完成后,会有提示

训练完成

可在output文件夹中找到训练完的模型

最终的模型是没有数字的那个
模型列表

将模型放入Stable Diffusion webui 中models/Lora文件夹下,启动webui(关于Stable Diffusion的安装教程,可以查看我的另外一篇文章Debian Linux 安装 Stable Diffusion

模型放置位置

LoRA选项卡里就能看到你训练完的模型了

模型列表