昇腾社区首页
中文
注册

aclnnUpsampleNearestExact2d

产品支持情况

产品 是否支持
[object Object]Atlas A3 训练系列产品/Atlas A3 推理系列产品[object Object]
[object Object]Atlas A2 训练系列产品/Atlas 800I A2 推理产品/A200I A2 Box 异构组件[object Object]
[object Object]Atlas 200I/500 A2 推理产品[object Object] ×
[object Object]Atlas 推理系列产品 [object Object]
[object Object]Atlas 训练系列产品[object Object] ×

功能说明

  • 算子功能:对由四个输入通道组成的输入信号应用最近邻精确插值算法进行上采样。如果输入shape为(N,C,H,W),则输出shape为(N,C,outputSize[0],outputSize[1])。
  • 计算公式:hsrc=min(floor((hdst+0.5)scalesH),H1)h_{src} = min(floor((h_{dst} + 0.5) * scalesH), H - 1) wsrc=min(floor((wdst+0.5)scalesW),W1)w_{src} = min(floor((w_{dst} + 0.5) * scalesW), W - 1) out(N,C,hdst,wdst)=self(N,C,hsrc,wsrc)out(N, C, h_{dst}, w_{dst}) = self(N, C, h_{src}, w_{src})

函数原型

每个算子分为undefined,必须先调用“aclnnUpsampleNearestExact2dGetWorkspaceSize”接口获取计算所需workspace大小以及包含了算子计算流程的执行器,再调用“aclnnUpsampleNearestExact2d”接口执行计算。

  • aclnnStatus aclnnUpsampleNearestExact2dGetWorkspaceSize(const aclTensor *self, const aclIntArray *outputSize, double scalesH, double scalesW, aclTensor *out, uint64_t *workspaceSize, aclOpExecutor **executor)
  • aclnnStatus aclnnUpsampleNearestExact2d(void *workspace, uint64_t workspaceSize, aclOpExecutor *executor, aclrtStream stream)

aclnnUpsampleNearestExact2dGetWorkspaceSize

  • 参数说明

    • self(aclTensor*,计算输入):公式中的输入self,Device侧的aclTensor。表示进行上采样的输入张量。支持undefinedundefined支持NCHW、NHWC、ND(当数据格式为ND时,默认按照NCHW格式处理)。支持空tensor。输入维度必须是4维。
      • [object Object]Atlas 推理系列产品[object Object]:数据类型支持FLOAT、FLOAT16。
      • [object Object]Atlas A2 训练系列产品/Atlas 800I A2 推理产品/A200I A2 Box 异构组件[object Object]、[object Object]Atlas A3 训练系列产品/Atlas A3 推理系列产品[object Object]:数据类型支持FLOAT、FLOAT16、BFLOAT16。
    • outputSize(aclIntArray*,计算输入):Host侧的aclIntArray,size大小为2,表示指定out在H和W维度上的空间大小。数据类型支持INT64。
    • scalesH(double,计算输入):公式中的输入scalesH,Host侧的DOUBLE型参数,指定H方向空间大小的缩放乘数。
    • scalesW(double,计算输入):公式中的输入scalesW,Host侧的DOUBLE型参数,指定W方向空间大小的缩放乘数。
    • out(aclTensor*,计算输出):公式中的输出out,Device侧的aclTensor。表示采样后的输出张量。支持undefinedundefined支持NCHW、NHWC、ND。支持空tensor。数据类型与入参self的数据类型保持一致。
      • [object Object]Atlas 推理系列产品[object Object]:数据类型支持FLOAT、FLOAT16。
      • [object Object]Atlas A2 训练系列产品/Atlas 800I A2 推理产品/A200I A2 Box 异构组件[object Object]、[object Object]Atlas A3 训练系列产品/Atlas A3 推理系列产品[object Object]:数据类型支持FLOAT、FLOAT16、BFLOAT16。
    • workspaceSize(uint64_t*,出参):返回需要在Device侧申请的workspace大小。
    • executor(aclOpExecutor**,出参):返回op执行器,包含了算子计算流程。
  • 返回值

    aclnnStatus:返回状态码,具体参见undefined

    [object Object]

aclnnUpsampleNearestExact2d

  • 参数说明

    • workspace(void*, 入参):在Device侧申请的workspace内存地址。
    • workspaceSize(uint64_t, 入参):在Device侧申请的workspace大小,由第一段接口aclnnUpsampleNearestExact2dGetWorkspaceSize获取。
    • executor(aclOpExecutor*, 入参):op执行器,包含了算子计算流程。
    • stream(aclrtStream, 入参):指定执行任务的Stream。
  • 返回值

    aclnnStatus:返回状态码,具体参见undefined

约束说明

参数outputSize的H轴和W轴与参数scalesH和参数scalesW,在使用时二选一,即:

  • 当入参scalesH或入参scalesW的值小于等于0时,使用入参outputSize中对应轴的参数值。
  • 当入参scalesH或入参scalesW的值大于0时,使用入参scalesH或入参scalesW的参数值,即outputSize对应轴的值为floor(self_HscalesH)floor(self\_H * scalesH),或者floor(self_WscalesW)floor(self\_W * scalesW)

调用示例

示例代码如下,仅供参考,具体编译和执行过程请参考undefined

[object Object]