aclnnSmoothL1LossBackward
支持的产品型号
- Atlas 推理系列产品。
- Atlas 训练系列产品。
- Atlas A2训练系列产品/Atlas 800I A2推理产品。
接口原型
每个算子分为,必须先调用“aclnnSmoothL1LossBackwardGetWorkspaceSize”接口获取计算所需workspace大小以及包含了算子计算流程的执行器,再调用“aclnnSmoothL1LossBackward”接口执行计算。
aclnnStatus aclnnSmoothL1LossBackwardGetWorkspaceSize(const aclTensor *gradOut, const aclTensor *self, const aclTensor *target, int64_t reduction, float beta, aclTensor *gradInput, uint64_t *workspaceSize, aclOpExecutor **executor)
aclnnStatus aclnnSmoothL1LossBackward(void *workspace, uint64_t workspaceSize, aclOpExecutor *executor, aclrtStream stream)
功能描述
算子功能: 计算SmoothL1损失函数的反向传播。
计算公式:
SmoothL1Loss的反向传播可以通过求导计算。对于SmoothL1Loss的第一种情况,即|x-y|<1,其导数为:
对于SmoothL1Loss的第二种情况,即|x-y|≥1,其导数为:
其中sign(x)表示x的符号函数,即:
aclnnSmoothL1LossBackwardGetWorkspaceSize
参数说明:
gradOut(const aclTensor *,计算输入):公式中的梯度反向输入即
SmoothL1Loss
,shape需要与self,target满足,数据类型支持FLOAT、FLOAT16、BFLOAT16,其中BFLOAT16仅Atlas A2训练系列产品/Atlas 800I A2推理产品支持,且数据类型与self、target的数据类型需,支持非连续的Tensor, 支持ND。self(const aclTensor *,计算输入):公式中的
x
,shape需要与gradOut,target满足,数据类型支持FLOAT、FLOAT16、BFLOAT16,其中BFLOAT16仅Atlas A2训练系列产品/Atlas 800I A2推理产品支持,且数据类型与gradOut、target的数据类型需,支持非连续的Tensor, 支持ND。target(const aclTensor *,计算输入):公式中的
y
,shape需要与gradOut,self满足,数据类型支持FLOAT、FLOAT16、BFLOAT16,其中BFLOAT16仅Atlas A2训练系列产品/Atlas 800I A2推理产品支持,且数据类型与gradOut、target的数据类型需,支持非连续的Tensor, 支持ND。reduction(int64_t,计算输入): 计算属性,指定要应用到输出的缩减,支持0('none')|1('mean')|2('sum')。'none'表示不应用减少,'mean'表示输出的总和将除以输出中的元素数,'sum'表示输出将被求和。
beta(float,计算输入):计算属性,指定在L1和L2损失之间更改的数值,数据类型为float,该值必须是非负的。
gradInput(aclTensor *,计算输出):shape为gradOut,self,target的broadcast结果,数据类型支持FLOAT、FLOAT16、BFLOAT16,其中BFLOAT16仅Atlas A2训练系列产品/Atlas 800I A2推理产品支持,支持非连续tensor,支持ND。
workspaceSize(uint64_t *,出参):返回用户需要在Device侧申请的workspace大小。
executor(aclOpExecutor **,出参):返回op执行器,包含了算子计算流程。
返回值:
[object Object]
aclnnSmoothL1LossBackward
参数说明:
workspace(void *, 计算输入): 在Device侧申请的workspace内存地址。
workspaceSize(uint64_t, 计算输入): 在Device侧申请的workspace大小,由第一段接口aclnnSmoothL1LossBackwardGetWorkspaceSize获取。
executor(aclOpExecutor *, 计算输入): op执行器,包含了算子计算流程。
stream(aclrtStream, 计算输入): 指定执行任务的 AscendCL Stream流。
返回值:
约束与限制
无。