昇腾社区首页
中文
注册

aclnnReflectionPad2dBackward

支持的产品型号

  • Atlas 推理系列产品。
  • Atlas 训练系列产品。
  • Atlas A2训练系列产品。

接口原型

每个算子分为,必须先调用“aclnnReflectionPad2dBackwardGetWorkspaceSize”接口获取计算所需workspace大小以及包含了算子计算流程的执行器,再调用“aclnnReflectionPad2dBackward”接口执行计算。

  • aclnnStatus aclnnReflectionPad2dBackwardGetWorkspaceSize(const aclTensor *gradOutput, const aclTensor *self, const aclIntArray *padding, aclTensor *gradInput, uint64_t *workspaceSize, aclOpExecutor **executor)

  • aclnnStatus aclnnReflectionPad2dBackward(void *workspace, uint64_t workspaceSize, aclOpExecutor *executor, const aclrtStream stream)

功能描述

  • 算子功能:反射填充的反向传播。

  • 计算公式:

    ac=(c)(a)=(c)(b)(b)(a)\nabla_ac = \frac{\partial(c)}{\partial(a)} = \frac{\partial(c)}{\partial(b)}* \frac{\partial(b)}{\partial(a)}

    a:原张量。

    b:reflection_pad2d正向结果。

    c:所有元素之和,为标量。

aclnnReflectionPad2dBackwardGetWorkspaceSize

  • 参数说明:

    • gradOutput(const aclTensor *, 计算输入): Device侧的aclTensor,数据类型支持FLOAT16, FLOAT32, DOUBLE, COMPLEX64, COMPLEX128,支持支持ND,维度支持三维或四维且与self和gradInput一致,shape需要与reflection_pad2d正向传播的output一致。

    • self(const aclTensor *, 计算输入):Device侧的aclTensor,数据类型与gradOutput一致,支持支持ND,维度支持三维或四维且与gradOutput和gradInput一致,shape与gradInput一致。

    • padding(const aclIntArray *, 计算输入):Device侧的aclIntArray数组,数据类型为INT64,长度为4。padding前两个数值需小于self最后一维度的数值,后两个数值需小于self倒数第二维度的数值。

    • gradInput(const aclTensor *, 计算输出):Device侧的aclTensor,数据类型与gradOutput一致,shape与self一致,支持支持ND,维度支持三维或四维且与gradOutput和self一致,shape与self一致。

    • workspaceSize(uint64_t *, 出参):返回用户需要在Device侧申请的workspace大小。

    • executor(aclOpExecutor **, 出参):返回op执行器,包含了算子计算流程。

  • 返回值:

    aclnnStatus:返回状态码,具体参见

    [object Object]

aclnnReflectionPad2dBackward

  • 参数说明:

    • workspace(void *):在Device侧申请的workspace内存地址。

    • workspaceSize(uint64_t):在Device侧申请的workspace大小,由第一段接口aclnnReflectionPad2dBackwardGetWorkspaceSize获取。

    • executor(aclOpExecutor *):op执行器,包含了算子计算流程。

    • stream(const aclrtStream):指定执行任务的 AscendCL Stream流。

  • 返回值:

    aclnnStatus:返回状态码,具体参见

约束与限制

无。

调用示例

示例代码如下,仅供参考,具体编译和执行过程请参考

[object Object]