下载
中文
注册
Diffusers_v0.18.1-PyTorch

概述

简述

扩散模型 (Diffusion Models) 是一种生成模型,可生成各种各样的高分辨率图像。Diffusers 是Huggingface发布的模型套件,包含基于扩散模型的多种下游任务训练与推理,可用于生成图像、音频,甚至分子的 3D 结构。

  • 参考实现:

    [object Object]
  • 适配昇腾 AI 处理器的实现:

    [object Object]

准备训练环境

准备环境

  • 当前模型支持的 PyTorch 版本和已知三方库依赖如下表所示。

    表 1 版本支持表

    Torch_Version 三方库依赖版本
    PyTorch 1.8 diffusers==0.18.1 accelerate==0.20.3
  • 环境准备指导。

    请参考《Pytorch框架训练环境准备》搭建torch环境。

  • 安装依赖。

    在模型根目录下执行命令,安装模型对应PyTorch版本需要的依赖。

    [object Object]
  • 修改三方库代码:

    [object Object]
  • 卸载safetensors(如有):

    [object Object]
  • 安装Megatron-LM,参考链接

准备数据集

  1. 获取数据集。

    联网情况下,数据集会自动下载。

    无网络情况下,用户需自行获取arrow格式的pokemon数据集,并在shell启动脚本时传入--local_data_dir参数,参数值为本地数据集路径,填写一级目录,数据结构如下:

    [object Object]

    说明: 该数据集的训练过程脚本只作为一种参考示例。

获取预训练模型

联网情况下,预训练模型会自动下载。无网络时,用户可访问huggingface官网自行下载,文件namespace如下:

[object Object]

获取对应的预训练模型后,在shell启动脚本时传入--model_name参数,参数值为本地预训练模型路径,填写一级目录。

开始训练

训练模型

本节以文生图下游任务为例,展示模型训练方法,其余下游任务controlnet、dreambooth、textual inversion等需要替换启动脚本。

  1. 进入解压后的源码包根目录。

    [object Object]
  2. 运行训练脚本。

    该模型支持单机单卡训练和单机8卡训练。

    • 单机单卡训练

      [object Object]
    • 单机8卡训练

      [object Object]

    模型训练python训练脚本参数说明如下。

    [object Object]

    训练完成后,权重文件保存在test/output路径下,并输出模型训练精度和性能信息。

训练结果展示

表 2 训练结果展示表

NAME sd版本 clip_score(use_ema) FPS batch_size AMP_Type Torch_Version
1p-竞品A 1.5 \ 1.313 1 fp32 1.13
1p-NPU 1.5 \ 1.312 1 fp32 1.8
8p-竞品A 1.5 \ 54.000 3 fp16 1.13
8p-NPU-910 1.5 \ 24.000 3 fp16 1.8
8p-竞品A 1.5 \ 61.57 4 fp16 1.13
8p-NPU-910B 1.5 \ 35.290 4 fp16 1.8
8p-竞品A 1.5 \ 33.82 4 fp32 1.13
8p-NPU-910B 1.5 0.319 31.000 4 fp32 1.8
8p-竞品A 2.1 0.321 8.64 4 fp32 1.13
8p-NPU-910B 2.1 \ 16.000 4 fp32 1.8
8p-NPU-910B 2.1 \ 13.47 4 fp32 1.11

表3 训练支持场景

SD版本/AMP_Type fp16 fp32
SD1.5 支持,需设置--mixd_precision="fp16" 支持,需设置--mixd_precision="no"
SD2.1 不支持 支持,需设置--mixd_precision="no"

说明:

910A仅支持fp16训练,在训练时必须指定--mixd_precision="fp16";910B同时支持fp16与fp32训练。

推理

文生图

参考实现:(https://huggingface.co/docs/diffusers/using-diffusers/conditional_image_generation)

预训练模型准备

联网情况下,预训练模型会自动下载。无网络时,用户可访问huggingface官网自行下载,文件namespace如下:

[object Object]

获得对应的预训练模型后,修改以下代码中的地址为本地地址即可

[object Object]

运行在线推理

[object Object]

修改prompt等操作需要对代码进行修改

文本指导图生图

参考实现:(https://huggingface.co/docs/diffusers/using-diffusers/img2img)

预训练模型准备

联网情况下,预训练模型会自动下载。无网络时,用户可访问huggingface官网自行下载,文件namespace如下:

[object Object]

获得对应的预训练模型后,修改以下代码中的地址为本地地址即可

[object Object]

运行在线推理

修改test_infer/text-guide-img-to-img.py中url为本地图片地址

[object Object]

修改prompt等操作需要对代码进行修改

文本指导图像修复

参考实现:(https://huggingface.co/docs/diffusers/using-diffusers/inpaint)

预训练模型准备

联网情况下,预训练模型会自动下载。无网络时,用户可访问huggingface官网自行下载,文件namespace如下:

[object Object]

获得对应的预训练模型后,修改以下代码中的地址为本地地址即可

[object Object]

运行在线推理

[object Object]

修改prompt等操作需要对代码进行修改

纹理反转

参考实现:(https://huggingface.co/docs/diffusers/using-diffusers/textual_inversion_inference)

预训练模型准备

联网情况下,预训练模型会自动下载。无网络时,用户可访问huggingface官网自行下载,文件namespace如下:

[object Object]

获得对应的预训练模型后,修改以下代码中的地址为本地地址即可

[object Object]

数据集准备

联网情况下,数据会自动下载。无网络时,用户可访问huggingface官网自行下载,文件namespace如下。用户也可参考该数据集自行准备数据集:

[object Object]

获得对应的预训练模型后,修改以下代码中的地址为本地地址即可

[object Object]

运行在线推理

[object Object]

修改prompt等操作需要对代码进行修改

文本指导图像深度生成

参考实现:(https://huggingface.co/docs/diffusers/using-diffusers/depth2img)

预训练模型准备

联网情况下,预训练模型会自动下载。无网络时,用户可访问huggingface官网自行下载,文件namespace如下:

[object Object]

获得对应的预训练模型后,修改以下代码中的地址为本地地址即可

[object Object]

运行在线推理

[object Object]

修改prompt等操作需要对代码进行修改

无条件图像生成

参考实现:(https://huggingface.co/docs/diffusers/using-diffusers/unconditional_image_generation)

预训练模型准备

联网情况下,预训练模型会自动下载。无网络时,用户可访问huggingface官网自行下载,文件namespace如下:

[object Object]

获得对应的预训练模型后,修改以下代码中的地址为本地地址即可

[object Object]

运行在线推理

[object Object]

修改prompt等操作需要对代码进行修改

公网地址说明

代码涉及公网地址参考 public_address_statement.md

版本说明

变更

2023.06.20:首次发布。

FAQ

  1. 使用训练后的权重推理,如果出现NSFW检测,需要在推理前,关闭模型中的NSFW检测,具体做法:

    [object Object]
使用模型资源和服务前,请您仔细阅读并理解透彻 《昇腾深度学习模型许可协议 3.0》