昇腾社区首页
中文
注册
开发者
下载

aclnnAddcmul&aclnnInplaceAddcmul

产品支持情况

[object Object]undefined

功能说明

  • 接口功能:执行 tensor1 与 tensor2 的逐元素乘法,将结果乘以标量值value并与输入self/selfRef做逐元素加法。
  • 计算公式:out=self+value×tensor1×tensor2out = self + value \times tensor1 \times tensor2 其中,当使用aclnnAddcmul时,公式中的self对应第一段接口中的self,公式中的out对应第一段接口中的out;当使用aclnnInplaceAddcmul时,公式中的self对应第一段接口中的selfRef,公式中的out对应第一段接口中的selfRef

函数原型

  • aclnnAddcmul和aclnnInplaceAddcmul实现相同的功能,使用区别如下,请根据自身实际场景选择合适的算子。

    • aclnnAddcmul:需新建一个输出张量对象存储计算结果。
    • aclnnInplaceAddcmul:无需新建输出张量对象,直接在输入张量的内存中存储计算结果。
  • 每个算子分为,必须先调用 “aclnnAddcmulGetWorkspaceSize” 或者 “aclnnInplaceAddcmulGetWorkspaceSize” 接口获取计算所需workspace大小以及包含了算子计算流程的执行器,再调用 “aclnnAddcmul” 或者 “aclnnInplaceAddcmul” 接口执行计算。

    [object Object]
    [object Object]
    [object Object]
    [object Object]

aclnnAddcmulGetWorkspaceSize

  • 参数说明:

    [object Object]
    • [object Object]Atlas 训练系列产品[object Object]:不支持BFLOAT16数据类型。
  • 返回值:

    aclnnStatus:返回状态码,具体参见

    第一段接口完成入参校验,出现如下场景时报错:

    [object Object]

aclnnAddcmul

  • 参数说明:

    [object Object]
  • 返回值:

    aclnnStatus:返回状态码,具体参见

aclnnInplaceAddcmulGetWorkspaceSize

  • 参数说明:

    [object Object]
    • [object Object]Atlas 训练系列产品[object Object]:不支持BFLOAT16数据类型。
  • 返回值:

    aclnnStatus:返回状态码,具体参见

    第一段接口完成入参校验,出现如下场景时报错:

    [object Object]

aclnnInplaceAddcmul

  • 参数说明:

    [object Object]
  • 返回值:

    aclnnStatus:返回状态码,具体参见

约束说明

  • 确定性计算:
    • aclnnAddcmul&aclnnInplaceAddcmul默认确定性实现。

调用示例

示例代码如下,仅供参考,具体编译和执行过程请参考

aclnnAddcmul

[object Object]

aclnnInplaceAddcmul

[object Object]