使用说明
Ascend C提供一组Conv3DBackpropInput高阶API,便于用户快速实现卷积的反向运算,求解反向传播的误差。转置卷积Conv3DTranspose与Conv3DBackpropInput具有相同的数学过程,因此用户也可以使用Conv3DBackpropInput高阶API实现转置卷积算子。卷积的正反向传播如图1,反向传播误差计算如图2 反向传播误差计算示意图。
Conv3DBackpropInput的计算公式为:
- ∂L/∂Y为卷积正向损失函数对输出Y的梯度GradOutput,作为求反向传播误差∂L/∂X的输入。
- W为卷积正向Weight权重,即矩阵核Kernel,也是滤波器Filter,作为求反向传播误差∂L/∂X的输入,WT表示W的转置。
- ∂L/∂X为特征矩阵的反向传播误差GradInput。
实现Conv3DBackpropInput求解反向传播误差运算的具体步骤如下:
- 创建Conv3DBackpropInput对象。
- 初始化操作。
- 设置卷积的输出反向GradOutput、卷积的输入Weight。
- 完成卷积反向操作。
- 结束卷积反向操作。
下文中提及的M轴方向,即为GradOutput矩阵纵向;K轴方向,即为GradOutput矩阵横向或Weight矩阵纵向;N轴方向,即为Weight矩阵横向。
- 创建Conv3DBackpropInput对象。
1 2 3 4 5 6 7
#include "lib/conv_backprop/conv3d_bp_input_api.h" using weightDxType = ConvBackpropApi::ConvType<ConvCommonApi::TPosition::GM, ConvCommonApi::ConvFormat::FRACTAL_Z_3D, weightType>; using inputSizeDxType = ConvBackpropApi::ConvType<ConvCommonApi::TPosition::GM, ConvCommonApi::ConvFormat::ND, int32_t>; using gradOutputDxType = ConvBackpropApi::ConvType<ConvCommonApi::TPosition::GM, ConvCommonApi::ConvFormat::NDC1HWC0, gradOutputType>; using gradInputDxType = ConvBackpropApi::ConvType<ConvCommonApi::TPosition::GM, ConvCommonApi::ConvFormat::NCDHW, gradInputType>; ConvBackpropApi::Conv3DBackpropInput<weightDxType, inputSizeDxType, gradOutputDxType, gradInputDxType> gradInput_;
创建对象时需要传入权重矩阵Weight、卷积正向特征矩阵Input的shape信息InputSize、GradOutput和GradInput的参数类型信息,类型信息通过ConvType来定义,包括:内存逻辑位置、数据格式、数据类型。
1 2 3 4 5 6
template <TPosition POSITION, ConvFormat FORMAT, typename T> struct ConvType { constexpr static TPosition pos = POSITION; // Convolution输入或输出的逻辑位置 constexpr static ConvFormat format = FORMAT; // Convolution输入或输出的数据格式 using Type = T; // Convolution输入或输出的数据类型 };
表1 ConvType说明 参数
说明
POSITION
内存逻辑位置。
- Weight矩阵可设置为TPosition::GM
- GradOutput矩阵可设置为TPosition::GM
- InputSize可设置为TPosition::GM
- GradInput矩阵可设置为TPosition::GM
ConvFormat
数据格式。
- Weight矩阵可设置为ConvFormat::FRACTAL_Z_3D
- GradOutput矩阵可设置为ConvFormat::NDC1HWC0
- InputSize矩阵可设置为ConvFormat::ND
- GradInput矩阵可设置为ConvFormat::NDC1HWC0
TYPE
数据类型。- Weight矩阵可设置为half、bfloat16_t
- GradOutput矩阵可设置为half、bfloat16_t
- InputSize矩阵可设置为int32_t
- GradInput矩阵可设置为half、bfloat16_t
注意:GradOutput矩阵和Weight矩阵数据类型需要一致,具体数据类型组合关系请参考表2。
表2 Conv3DBackpropInput输入输出数据类型的组合说明 Weight
GradOutput
InputSize
GradInput
支持平台
half
half
int32_t
half
Atlas A3 训练系列产品/Atlas A3 推理系列产品 Atlas A2 训练系列产品/Atlas 800I A2 推理产品/A200I A2 Box 异构组件
bfloat16_t
bfloat16_t
int32_t
bfloat16_t
Atlas A3 训练系列产品/Atlas A3 推理系列产品 Atlas A2 训练系列产品/Atlas 800I A2 推理产品/A200I A2 Box 异构组件
- 初始化操作。
1 2 3
// 注册后进行初始化 ConvBackpropApi::Conv3DBackpropInput<weightDxType, inputSizeDxType, gradOutputDxType, gradInputDxType> gradInput_; gradInput_.Init(&(tilingData->conv3DDxTiling));
- 设置3D卷积的输出反向GradOutput、3D卷积的输入Weight。
1 2 3 4
gradInput_.SetSingleShape(singleShapeM_, singleShapeK_, singleShapeN_); // 设置单核计算的形状 gradInput_.SetStartPosition(dinStartIdx_, curHoStartIdx_); // 设置单核上gradOutput载入的起始位置 gradInput_.SetGradOutput(gradOutputGm_[offsetA_]); gradInput_.SetWeight(weightGm_[offsetB_]);
- 完成卷积反向操作。调用Iterate完成单次迭代计算,叠加while循环完成单核全量数据的计算。Iterate方式,可以自行控制迭代次数,完成所需数据量的计算。
1 2 3
while (gradInput_.Iterate()) { gradInput_.GetTensorC(gradInputGm_[offsetC_]); }
- 结束卷积反向操作。
1
gradInput_.End();
父主题: Conv3DBackpropInput