aclnnRmsNormGrad
支持的产品型号
- Atlas 推理系列产品。
- Atlas A2训练系列产品/Atlas 800I A2推理产品。
接口原型
每个算子分为两段式接口,必须先调用“aclnnRmsNormGradGetWorkspaceSize”接口获取计算所需workspace大小以及包含了算子计算流程的执行器,再调用“aclnnRmsNormGrad”接口执行计算。
aclnnStatus aclnnRmsNormGradGetWorkspaceSize( const aclTensor *dy, const aclTensor *x, const aclTensor *rstd, const aclTensor *gamma, const aclTensor *dxOut, const aclTensor *dgammaOut, uint64_t *workspaceSize, aclOpExecutor **executor)
aclnnStatus aclnnRmsNormGrad( void *workspace, uint64_t workspaceSize, aclOpExecutor *executor, aclrtStream stream)
功能描述
aclnnRmsNormGradGetWorkspaceSize
参数说明:
- dy(aclTensor*,计算输入):Device侧的aclTensor,表示反向传回的梯度。支持ND,shape支持1-8维度。
- Atlas 推理系列产品:数据类型支持FLOAT32,FLOAT16。
- Atlas A2训练系列产品/Atlas 800I A2推理产品:数据类型支持FLOAT32,FLOAT16,BFLOAT16。
- x(aclTensor*,计算输入):Host侧的aclTensor,正向算子的输入,表示被标准化的数据。支持ND,shape支持1-8维度,且与入参
dy
的shape一致。- Atlas 推理系列产品:数据类型支持FLOAT32,FLOAT16。
- Atlas A2训练系列产品/Atlas 800I A2推理产品:数据类型支持FLOAT32,FLOAT16,BFLOAT16。
- rstd(aclTensor*,计算输入):Host侧的aclTensor,正向算子的中间计算结果。数据类型支持FLOAT32。支持ND,shape支持1-8维度,shape需要满足rstd_shape = x_shape[0:n],n < x_shape.dims(),n与gamma一致。
- gamma(aclTensor*,计算输入):Host侧的aclTensor,正向算子的输入。支持ND,shape支持1-8维度,shape需要满足gamma_shape = x_shape[n:], n < x_shape.dims()。
- Atlas 推理系列产品:数据类型支持FLOAT32,FLOAT16。
- Atlas A2训练系列产品/Atlas 800I A2推理产品:数据类型支持FLOAT32,FLOAT16,BFLOAT16。
- dxOut(aclTensor*,计算输出):Host侧的aclTensor,表示输入
x
的梯度。支持ND,shape支持1-8维度,shape与入参dy
的shape保持一致。- Atlas 推理系列产品:数据类型支持FLOAT32,FLOAT16。
- Atlas A2训练系列产品/Atlas 800I A2推理产品:数据类型支持FLOAT32,FLOAT16,BFLOAT16。
- dgammaOut(aclTensor*,计算输出):Device侧的aclTensor,表示
gamma
的梯度。数据类型支持FLOAT32。支持ND,shape支持1-8维度,shape与入参gamma
的shape保持一致。 - workspaceSize(uint64_t*,出参):返回用户需要在Device侧申请的workspace大小。
- executor(aclOpExecutor**,出参):返回op执行器,包含了算子计算流程。
- dy(aclTensor*,计算输入):Device侧的aclTensor,表示反向传回的梯度。支持ND,shape支持1-8维度。
返回值:
[object Object]
aclnnRmsNormGrad
参数说明:
- workspace(void*,入参):在Device侧申请的workspace内存地址。
- workspaceSize(uint64_t,入参):在Device侧申请的workspace大小,由第一段接口aclnnRmsNormGradGetWorkspaceSize获取。
- executor(aclOpExecutor*,入参):op执行器,包含了算子计算流程。
- stream(aclrtStream,入参):指定执行任务的AscendCL Stream流。
约束与限制
- 功能维度
- 未支持类型说明
- 边界值场景说明
- Atlas 推理系列产品:输入不支持包含inf和nan 各产品支持数据类型说明
- Atlas A2训练系列产品/Atlas 800I A2推理产品:
dy
数据类型x
数据类型rstd
数据类型gamma
数据类型dx
数据类型dgamma
数据类型float16 float16 float32 float32 float16 float32 bfloat16 bfloat16 float32 float32 bfloat16 float32 float16 float16 float32 float16 float16 float32 float32 float32 float32 float32 float32 float32 bfloat16 bfloat16 float32 bfloat16 bfloat16 float32 - Atlas 推理系列产品:
dy
数据类型x
数据类型rstd
数据类型gamma
数据类型dx
数据类型dgamma
数据类型float16 float16 float32 float16 float16 float32 float32 float32 float32 float32 float32 float32
调用示例
[object Object]