Skip to content

Training Lora

Bubbliiiing edited this page Dec 13, 2024 · 2 revisions

Lora训练

数据集准备

我们提供了一个可供CogVideoX-Fun进行Lora训练的图文数据集。

这是一个人像的Minimalism极简风数据集,共包含约20张图片,其中demo如下所示:

请添加图片描述

数据集中已经提供了标注信息。我们可以将其放置在datasets目录下,如下图所示。

image

在这里我们即可使用相对路径也可以使用绝对路径,为了不同机器的使用方便,这里我使用了相对路径。

如果同学们期待使用自己的数据集进行训练,训练准备数据集json文件,数据集json文件的格式如下:

[
    {
      "file_path": "videos/00000001.mp4",
      "text": "A group of young men in suits and sunglasses are walking down a city street.",
      "type": "video"
    },
    {
      "file_path": "train/00000001.jpg",
      "text": "A group of young men in suits and sunglasses are walking down a city street.",
      "type": "image"
    },
    .....
]

其中,file_path指的是文件的路径,type指的是文件的种类,有video和image两种,text指的是视频对应的描述。

训练sh文件修改

训练Lora权重需要使用到scripts/train_lora.sh文件,我们主要修改其中的DATASET_NAME和DATASET_META_NAME。

DATASET_NAME指向了数据集相对路径的根目录,以本文的摆放路径为例,直接指定仓库的根目录即可,即"./"

DATASET_META_NAME指向了数据集对应的json文件,指向Minimalism下的json文件,即"datasets/Minimalism/metadata_add_width_height.json"即可。

video_sample_n_frames设置为1,因为是图片数据集

为满足更低的显卡需求,在这里我们开启low_vram减少显存需求,当前最低显存要求为24G,对应A10、3090、4090、4090D显卡。

image

开始训练

开始训练的流程较为简单,在配置好的环境下直接sh scripts/train_lora.sh即可。开始训练后如下所示:

在这里插入图片描述

训练结果预测

我们首先根据自己的需要训练一定步数。然后将训练好的Lora移动到指定的文件夹。

image

然后python app.py启动webui,在页面上进行选择。

image

在这里插入图片描述

点击下方的生成即可获得结果。

生成结果

Clone this wiki locally