昇腾社区首页
中文
注册

使用说明

Ascend C提供一组Conv3DBackpropInput高阶API,便于用户快速实现卷积的反向运算,求解反向传播的误差。转置卷积Conv3DTranspose与Conv3DBackpropInput具有相同的数学过程,因此用户也可以使用Conv3DBackpropInput高阶API实现转置卷积算子。卷积的正反向传播如图1,反向传播误差计算如图2 反向传播误差计算示意图

Conv3DBackpropInput的计算公式为:

  • ∂L/∂Y为卷积正向损失函数对输出Y的梯度GradOutput,作为求反向传播误差∂L/∂X的输入。
  • W为卷积正向Weight权重,即矩阵核Kernel,也是滤波器Filter,作为求反向传播误差∂L/∂X的输入,WT表示W的转置。
  • ∂L/∂X为特征矩阵的反向传播误差GradInput。
图1 卷积层的前后向传播示意图
图2 反向传播误差计算示意图

实现Conv3DBackpropInput求解反向传播误差运算的具体步骤如下:

  1. 创建Conv3DBackpropInput对象。
  2. 初始化操作。
  3. 设置卷积的输出反向GradOutput、卷积的输入Weight。
  4. 完成卷积反向操作。
  5. 结束卷积反向操作。

    下文中提及的M轴方向,即为GradOutput矩阵纵向;K轴方向,即为GradOutput矩阵横向或Weight矩阵纵向;N轴方向,即为Weight矩阵横向。

  1. 创建Conv3DBackpropInput对象。
    1
    2
    3
    4
    5
    6
    7
    #include "lib/conv_backprop/conv3d_bp_input_api.h"
    
    using weightDxType = ConvBackpropApi::ConvType<ConvCommonApi::TPosition::GM, ConvCommonApi::ConvFormat::FRACTAL_Z_3D, weightType>;
    using inputSizeDxType =	ConvBackpropApi::ConvType<ConvCommonApi::TPosition::GM, ConvCommonApi::ConvFormat::ND, int32_t>;
    using gradOutputDxType = ConvBackpropApi::ConvType<ConvCommonApi::TPosition::GM, ConvCommonApi::ConvFormat::NDC1HWC0, gradOutputType>;
    using gradInputDxType = ConvBackpropApi::ConvType<ConvCommonApi::TPosition::GM, ConvCommonApi::ConvFormat::NCDHW, gradInputType>;
    ConvBackpropApi::Conv3DBackpropInput<weightDxType, inputSizeDxType, gradOutputDxType, gradInputDxType> gradInput_;
    

    创建对象时需要传入权重矩阵Weight、卷积正向特征矩阵Input的shape信息InputSize、GradOutput和GradInput的参数类型信息,类型信息通过ConvType来定义,包括:内存逻辑位置、数据格式、数据类型。

    1
    2
    3
    4
    5
    6
    template <TPosition POSITION, ConvFormat FORMAT, typename T>
    struct ConvType {
        constexpr static TPosition pos = POSITION;    // Convolution输入或输出的逻辑位置
        constexpr static ConvFormat format = FORMAT;  // Convolution输入或输出的数据格式
        using Type = T;                               // Convolution输入或输出的数据类型
    };
    
    表1 ConvType说明

    参数

    说明

    POSITION

    内存逻辑位置。

    • Weight矩阵可设置为TPosition::GM
    • GradOutput矩阵可设置为TPosition::GM
    • InputSize可设置为TPosition::GM
    • GradInput矩阵可设置为TPosition::GM

    ConvFormat

    数据格式。

    • Weight矩阵可设置为ConvFormat::FRACTAL_Z_3D
    • GradOutput矩阵可设置为ConvFormat::NDC1HWC0
    • InputSize矩阵可设置为ConvFormat::ND
    • GradInput矩阵可设置为ConvFormat::NDC1HWC0

    TYPE

    数据类型。
    • Weight矩阵可设置为half、bfloat16_t
    • GradOutput矩阵可设置为half、bfloat16_t
    • InputSize矩阵可设置为int32_t
    • GradInput矩阵可设置为half、bfloat16_t

    注意:GradOutput矩阵和Weight矩阵数据类型需要一致,具体数据类型组合关系请参考表2

    表2 Conv3DBackpropInput输入输出数据类型的组合说明

    Weight

    GradOutput

    InputSize

    GradInput

    支持平台

    half

    half

    int32_t

    half

    • Atlas A3 训练系列产品/Atlas A3 推理系列产品
    • Atlas A2 训练系列产品/Atlas 800I A2 推理产品/A200I A2 Box 异构组件

    bfloat16_t

    bfloat16_t

    int32_t

    bfloat16_t

    • Atlas A3 训练系列产品/Atlas A3 推理系列产品
    • Atlas A2 训练系列产品/Atlas 800I A2 推理产品/A200I A2 Box 异构组件
  2. 初始化操作。
    1
    2
    3
    // 注册后进行初始化
    ConvBackpropApi::Conv3DBackpropInput<weightDxType, inputSizeDxType, gradOutputDxType, gradInputDxType> gradInput_;
    gradInput_.Init(&(tilingData->conv3DDxTiling));
    
  3. 设置3D卷积的输出反向GradOutput、3D卷积的输入Weight。
    1
    2
    3
    4
    gradInput_.SetSingleShape(singleShapeM_, singleShapeK_, singleShapeN_); // 设置单核计算的形状
    gradInput_.SetStartPosition(dinStartIdx_, curHoStartIdx_); // 设置单核上gradOutput载入的起始位置
    gradInput_.SetGradOutput(gradOutputGm_[offsetA_]);
    gradInput_.SetWeight(weightGm_[offsetB_]); 
    
  4. 完成卷积反向操作。
    调用Iterate完成单次迭代计算,叠加while循环完成单核全量数据的计算。Iterate方式,可以自行控制迭代次数,完成所需数据量的计算。
    1
    2
    3
    while (gradInput_.Iterate()) {
        gradInput_.GetTensorC(gradInputGm_[offsetC_]); 
    }
    
  5. 结束卷积反向操作。
    1
    gradInput_.End();