aclnnDeepNormGrad

支持的产品型号

[object Object]Atlas 推理系列产品[object Object]。
[object Object]Atlas A2 训练系列产品/Atlas 800I A2 推理产品/A200I A2 Box 异构组件[object Object]。
[object Object]Atlas A3 训练系列产品/Atlas A3 推理系列产品[object Object]。

功能说明

算子功能：DeepNorm算子的反向计算。
计算公式：
$d_{gx_i} = tmpone_i * rstd + \frac{2}{D} * d_{var} * tmptwo_i + {\frac{1}{D}} * d_{mean}$ $d_{x_i} = alpha * {gx}_i$ $d_{beta} = \sum_{i=1}^{N} d_{y_i}$ $d_{gamma} = \sum_{i=1}^{N} d_{y_i} * rstd * {tmptwo}_i$
其中：
$tmpone_i = d_{y_i} * gamma$ $tmptwo_i = alpha * x_i + {gx}_i - mean$ $d_{var} = \sum_{i=1}^{N} (-0.5) * {tmpone}_i * {tmptwo}_i * {rstd}^3$ $d_{mean} = \sum_{i=1}^{N} (-1) * {tmpone}_i * rstd$

函数原型

每个算子分为undefined，必须先调用“aclnnDeepNormGradGetWorkspaceSize”接口获取计算所需workspace大小以及包含了算子计算流程的执行器，再调用“aclnnDeepNormGrad”接口执行计算。

aclnnStatus aclnnDeepNormGradGetWorkspaceSize(const aclTensor *dy, const aclTensor *x, const aclTensor *gx, const aclTensor *gamma, const aclTensor *mean, const aclTensor *rstd, double alpha, const aclTensor *dxOut, const aclTensor *dgxOut, const aclTensor *dbetaOut, const aclTensor *dgammaOut, uint64_t *workspaceSize, aclOpExecutor **executor)
aclnnStatus aclnnDeepNormGrad(void *workspace, uint64_t workspaceSize, aclOpExecutor *executor, aclrtStream stream)

aclnnDeepNormGradGetWorkspaceSize

参数说明：
- dy（aclTensor *，计算输入）：主要的grad输入。Device侧的aclTensor，shape支持2维-8维，undefined支持ND，不支持非连续输入。
  - [object Object]Atlas 推理系列产品[object Object]：数据类型支持FLOAT32、FLOAT16。
  - [object Object]Atlas A2 训练系列产品/Atlas 800I A2 推理产品/A200I A2 Box 异构组件[object Object]、[object Object]Atlas A3 训练系列产品/Atlas A3 推理系列产品[object Object]：数据类型支持FLOAT32、FLOAT16、BFLOAT16。
- x（aclTensor *，计算输入）：为正向融合算子的输入x。Device侧的aclTensor，shape支持2维-8维，undefined支持ND，不支持非连续输入。
  - [object Object]Atlas 推理系列产品[object Object]：数据类型支持FLOAT32、FLOAT16。
  - [object Object]Atlas A2 训练系列产品/Atlas 800I A2 推理产品/A200I A2 Box 异构组件[object Object]、[object Object]Atlas A3 训练系列产品/Atlas A3 推理系列产品[object Object]：数据类型支持FLOAT32、FLOAT16、BFLOAT16。
- gx（aclTensor *，计算输入）：为正向融合算子的输入gx。Device侧的aclTensor，shape支持2维-8维，undefined支持ND，不支持非连续输入。
  - [object Object]Atlas 推理系列产品[object Object]：数据类型支持FLOAT32、FLOAT16。
  - [object Object]Atlas A2 训练系列产品/Atlas 800I A2 推理产品/A200I A2 Box 异构组件[object Object]、[object Object]Atlas A3 训练系列产品/Atlas A3 推理系列产品[object Object]：数据类型支持FLOAT32、FLOAT16、BFLOAT16。
- gamma（aclTensor *，计算输入）：shape支持1维-7维，undefined支持ND，不支持非连续输入。
  - [object Object]Atlas 推理系列产品[object Object]：数据类型支持FLOAT32、FLOAT16。
  - [object Object]Atlas A2 训练系列产品/Atlas 800I A2 推理产品/A200I A2 Box 异构组件[object Object]、[object Object]Atlas A3 训练系列产品/Atlas A3 推理系列产品[object Object]：数据类型支持FLOAT32、FLOAT16、BFLOAT16。
- mean（aclTensor *，计算输入）：表示正向输入x、gx之和的均值。数据类型支持FLOAT32，shape支持2维-8维，undefined支持ND，不支持非连续输入。
- rstd（aclTensor *，计算输入）：表示正向输入x、gx之和的rstd。输入数据类型支持FLOAT32，shape支持2维-8维，undefined支持ND，不支持非连续输入。
- alpha(double，计算输入)：含义与deepnorm正向输入alpha相同，deepnorm输入x维度的乘数。
- dxOut（aclTensor *，计算输出）：shape支持2维-8维，undefined支持ND。
  - [object Object]Atlas 推理系列产品[object Object]：数据类型支持FLOAT32、FLOAT16。
  - [object Object]Atlas A2 训练系列产品/Atlas 800I A2 推理产品/A200I A2 Box 异构组件[object Object]、[object Object]Atlas A3 训练系列产品/Atlas A3 推理系列产品[object Object]：数据类型支持FLOAT32、FLOAT16、BFLOAT16。
- dgxOut（aclTensor *，计算输出）：shape支持2维-8维，undefined支持ND。
  - [object Object]Atlas 推理系列产品[object Object]：数据类型支持FLOAT32、FLOAT16。
  - [object Object]Atlas A2 训练系列产品/Atlas 800I A2 推理产品/A200I A2 Box 异构组件[object Object]、[object Object]Atlas A3 训练系列产品/Atlas A3 推理系列产品[object Object]：数据类型支持FLOAT32、FLOAT16、BFLOAT16。
- dbetaOut（aclTensor *，计算输出）：数据类型支持FLOAT32，shape支持1维-7维，undefined支持ND。
- dgammaOut（aclTensor *，计算输出）：数据类型支持FLOAT32，shape支持1维-7维，undefined支持ND。
- workspaceSize（uint64_t *，出参）：返回需要在Device侧申请的workspace大小。
- executor（aclOpExecutor **，出参）：返回op执行器，包含了算子计算流程。
返回值：

aclnnStatus：返回状态码，具体参见undefined。

[object Object]

aclnnDeepNormGrad

参数说明：
- workspace（void *，入参）：在Device侧申请的workspace内存地址。
- workspaceSize（uint64_t，入参）：在Device侧申请的workspace大小，由第一段接口aclnnDeepNormGradGetWorkspaceSize获取。
- executor（aclOpExecutor *，入参）：op执行器，包含了算子计算流程。
- stream（aclrtStream，入参）：指定执行任务的AscendCL stream流。
返回值：

aclnnStatus：返回状态码，具体参见undefined。

约束说明

功能维度
- 数据类型支持
  - [object Object]Atlas 推理系列产品[object Object]：dy、x、gx、gamma、dxOut、dgxOut支持FLOAT32、FLOAT16。
  - [object Object]Atlas A2 训练系列产品/Atlas 800I A2 推理产品/A200I A2 Box 异构组件[object Object]、[object Object]Atlas A3 训练系列产品/Atlas A3 推理系列产品[object Object]：dy、x、gx、gamma、dxOut、dgxOut支持FLOAT32、FLOAT16、BFLOAT16。
  - rstd、mean、dbetaOut、dgammaOut支持：FLOAT32。
- 数据格式支持：ND。
未支持类型说明
- DOUBLE：指令不支持DOUBLE。
- 是否支持空tensor：不支持空进空出。
- 是否支持非连续tensor：不支持输入非连续。
边界值场景说明
- 当输入是inf时，输出为inf。
- 当输入是nan时，输出为nan。

调用示例

示例代码如下，仅供参考，具体编译和执行过程请参考undefined。

[object Object]