使用说明

Ascend C提供一组Conv3DBackpropInput高阶API，便于用户快速实现卷积的反向运算，求解反向传播的误差。转置卷积Conv3DTranspose与Conv3DBackpropInput具有相同的数学过程，因此用户也可以使用Conv3DBackpropInput高阶API实现转置卷积算子。卷积的正反向传播如图1，反向传播误差计算如图2 反向传播误差计算示意图。

Conv3DBackpropInput的计算公式为：

$\text{[math]}$

∂L/∂Y为卷积正向损失函数对输出Y的梯度GradOutput，作为求反向传播误差∂L/∂X的输入。
W为卷积正向Weight权重，即矩阵核Kernel，也是滤波器Filter，作为求反向传播误差∂L/∂X的输入，W^T表示W的转置。
∂L/∂X为特征矩阵的反向传播误差GradInput。

图1 卷积层的前后向传播示意图

图2 反向传播误差计算示意图

实现Conv3DBackpropInput求解反向传播误差运算的具体步骤如下：

创建Conv3DBackpropInput对象。
初始化操作。
设置卷积的输出反向GradOutput、卷积的输入Weight。
完成卷积反向操作。
结束卷积反向操作。

下文中提及的M轴方向，即为GradOutput矩阵纵向；K轴方向，即为GradOutput矩阵横向或Weight矩阵纵向；N轴方向，即为Weight矩阵横向。

创建Conv3DBackpropInput对象。

       
            #include "lib/conv_backprop/conv3d_bp_input_api.h"

using weightDxType = ConvBackpropApi::ConvType<ConvCommonApi::TPosition::GM, ConvCommonApi::ConvFormat::FRACTAL_Z_3D, weightType>;
using inputSizeDxType =	ConvBackpropApi::ConvType<ConvCommonApi::TPosition::GM, ConvCommonApi::ConvFormat::ND, int32_t>;
using gradOutputDxType = ConvBackpropApi::ConvType<ConvCommonApi::TPosition::GM, ConvCommonApi::ConvFormat::NDC1HWC0, gradOutputType>;
using gradInputDxType = ConvBackpropApi::ConvType<ConvCommonApi::TPosition::GM, ConvCommonApi::ConvFormat::NCDHW, gradInputType>;
ConvBackpropApi::Conv3DBackpropInput<weightDxType, inputSizeDxType, gradOutputDxType, gradInputDxType> gradInput_;

创建对象时需要传入权重矩阵Weight、卷积正向特征矩阵Input的shape信息InputSize、GradOutput和GradInput的参数类型信息，类型信息通过ConvType来定义，包括：内存逻辑位置、数据格式、数据类型。

       
            template <TPosition POSITION, ConvFormat FORMAT, typename T>
struct ConvType {
    constexpr static TPosition pos = POSITION;    // Convolution输入或输出的逻辑位置
    constexpr static ConvFormat format = FORMAT;  // Convolution输入或输出的数据格式
    using Type = T;                               // Convolution输入或输出的数据类型
};

表1 ConvType说明
参数	说明
POSITION	内存逻辑位置。 Weight矩阵可设置为TPosition::GM GradOutput矩阵可设置为TPosition::GM InputSize可设置为TPosition::GM GradInput矩阵可设置为TPosition::GM
ConvFormat	数据格式。 Weight矩阵可设置为ConvFormat::FRACTAL_Z_3D GradOutput矩阵可设置为ConvFormat::NDC1HWC0 InputSize矩阵可设置为ConvFormat::ND GradInput矩阵可设置为ConvFormat::NDC1HWC0
TYPE	数据类型。 Weight矩阵可设置为half、bfloat16_t GradOutput矩阵可设置为half、bfloat16_t InputSize矩阵可设置为int32_t GradInput矩阵可设置为half、bfloat16_t 注意：GradOutput矩阵和Weight矩阵数据类型需要一致，具体数据类型组合关系请参考表2。

表2 Conv3DBackpropInput输入输出数据类型的组合说明
Weight	GradOutput	InputSize	GradInput	支持平台
half	half	int32_t	half	Atlas A3 训练系列产品/Atlas A3 推理系列产品 Atlas A2 训练系列产品/Atlas 800I A2 推理产品/A200I A2 Box 异构组件
bfloat16_t	bfloat16_t	int32_t	bfloat16_t	Atlas A3 训练系列产品/Atlas A3 推理系列产品 Atlas A2 训练系列产品/Atlas 800I A2 推理产品/A200I A2 Box 异构组件

初始化操作。

       
            // 注册后进行初始化
ConvBackpropApi::Conv3DBackpropInput<weightDxType, inputSizeDxType, gradOutputDxType, gradInputDxType> gradInput_;
gradInput_.Init(&(tilingData->conv3DDxTiling));

设置3D卷积的输出反向GradOutput、3D卷积的输入Weight。

       
            gradInput_.SetSingleShape(singleShapeM_, singleShapeK_, singleShapeN_); // 设置单核计算的形状
gradInput_.SetStartPosition(dinStartIdx_, curHoStartIdx_); // 设置单核上gradOutput载入的起始位置
gradInput_.SetGradOutput(gradOutputGm_[offsetA_]);
gradInput_.SetWeight(weightGm_[offsetB_]);

完成卷积反向操作。

调用Iterate完成单次迭代计算，叠加while循环完成单核全量数据的计算。Iterate方式，可以自行控制迭代次数，完成所需数据量的计算。

        
             while (gradInput_.Iterate()) {
    gradInput_.GetTensorC(gradInputGm_[offsetC_]); 
}

结束卷积反向操作。
1

gradInput_.End();

父主题： Conv3DBackpropInput