aclnnAddcmul&aclnnInplaceAddcmul
产品支持情况
功能说明
- 接口功能:执行 tensor1 与 tensor2 的逐元素乘法,将结果乘以标量值value并与输入self/selfRef做逐元素加法。
- 计算公式: 其中,当使用aclnnAddcmul时,公式中的self对应第一段接口中的self,公式中的out对应第一段接口中的out;当使用aclnnInplaceAddcmul时,公式中的self对应第一段接口中的selfRef,公式中的out对应第一段接口中的selfRef
函数原型
aclnnAddcmul和aclnnInplaceAddcmul实现相同的功能,使用区别如下,请根据自身实际场景选择合适的算子。
- aclnnAddcmul:需新建一个输出张量对象存储计算结果。
- aclnnInplaceAddcmul:无需新建输出张量对象,直接在输入张量的内存中存储计算结果。
每个算子分为,必须先调用 “aclnnAddcmulGetWorkspaceSize” 或者 “aclnnInplaceAddcmulGetWorkspaceSize” 接口获取计算所需workspace大小以及包含了算子计算流程的执行器,再调用 “aclnnAddcmul” 或者 “aclnnInplaceAddcmul” 接口执行计算。
[object Object][object Object][object Object][object Object]
aclnnAddcmulGetWorkspaceSize
参数说明:
[object Object]- [object Object]Atlas 训练系列产品[object Object]:不支持BFLOAT16数据类型。
返回值:
第一段接口完成入参校验,出现如下场景时报错:
[object Object]
aclnnAddcmul
aclnnInplaceAddcmulGetWorkspaceSize
参数说明:
[object Object]- [object Object]Atlas 训练系列产品[object Object]:不支持BFLOAT16数据类型。
返回值:
第一段接口完成入参校验,出现如下场景时报错:
[object Object]
aclnnInplaceAddcmul
约束说明
- 确定性计算:
- aclnnAddcmul&aclnnInplaceAddcmul默认确定性实现。
调用示例
aclnnAddcmul
[object Object]
aclnnInplaceAddcmul
[object Object]