aclnnSmoothL1Loss
支持的产品型号
- Atlas 训练系列产品。
- Atlas A2训练系列产品/Atlas 800I A2推理产品。
接口原型
每个算子分为,必须先调用“aclnnSmoothL1LossGetWorkspaceSize”接口获取计算所需workspace大小以及包含了算子计算流程的执行器,再调用“aclnnSmoothL1Loss”接口执行计算。
aclnnStatus aclnnSmoothL1LossGetWorkspaceSize(const aclTensor *self, const aclTensor *target, int64_t reduction, float beta, aclTensor *result, uint64_t *workspaceSize, aclOpExecutor **executor)
aclnnStatus aclnnSmoothL1Loss(void *workspace, uint64_t workspaceSize, aclOpExecutor *executor,aclrtStream stream)
功能描述
算子功能: 计算SmoothL1损失函数。
计算公式:
Batch为N的损失函数,当
reduction
为none时,此函数定义为:其中的为:
如果
reduction
为mean
或sum
时,
aclnnSmoothL1LossGetWorkspaceSize
参数说明:
self(const aclTensor *,计算输入):公式中的
self
,shape需要与target满足且最高支持8维,数据类型支持FLOAT、FLOAT16、BFLOAT16(仅Atlas A2训练系列产品/Atlas 800I A2推理产品支持),且数据类型需,支持非连续的Tensor, 支持ND,NCL,NCHW,NHWC。target(const aclTensor *,计算输入):公式中的
target
,shape需要与self满足且最高支持8维,数据类型支持FLOAT、FLOAT16、BFLOAT16(仅Atlas A2训练系列产品/Atlas 800I A2推理产品支持),且数据类型需,支持非连续的Tensor, 支持ND,NCL,NCHW,NHWC。reduction(int64_t,计算输入): 公式中的输入
reduction
,指定要应用到输出的缩减,支持0('none')|1('mean')|2('sum')。'none'表示不应用减少,'mean'表示输出的总和将除以输出中的元素数,'sum'表示输出将被求和。beta(float,计算输入): 数据类型支持FLOAT。
result(aclTensor *,计算输出):公式中输出的损失函数,当
reduction
为none
时,shape与self和target的broadcast结果一致,当reduction
为mean
或sum
时为[],数据类型支持FLOAT,FLOAT16、BFLOAT16(仅Atlas A2训练系列产品/Atlas 800I A2推理产品支持),支持非连续的tensor,支持ND,NCL,NCHW,NHWC。workspaceSize(uint64_t *,出参):返回用户需要在Device侧申请的workspace大小。
executor(aclOpExecutor **,出参):返回op执行器,包含了算子计算流程。
返回值:
[object Object]
aclnnSmoothL1Loss
参数说明:
workspace(void *):在Device侧申请的workspace内存地址。
workspaceSize(uint64_t):在Device侧申请的workspace大小,由第一段接口aclnnSmoothL1LossGetWorkspaceSize获取。
executor(aclOpExecutor *):op执行器,包含了算子计算流程。
stream(aclrtStream):指定执行任务的 AscendCL Stream流。
返回值:
约束与限制
无。