开发者
下载
[object Object]

[object Object][object Object]undefined
[object Object]
  • 接口功能:对由多个输入通道组成的输入信号应用最近邻插值算法进行上采样。如果输入shape为(N, C, H, W),则输出shape为(N, C, outputSize[0], outputSize[1])。
  • 计算公式:hsrc=min(floor((hdst+0.5)/scalesH),H1),scalesH=outputSize[0]/Hh_{src} = min(floor((h_{dst} + 0.5) / scalesH), H - 1),scalesH = outputSize[0] / H wsrc=min(floor((wdst+0.5)/scalesW),W1),scalesW=outputSize[1]/Ww_{src} = min(floor((w_{dst} + 0.5) / scalesW), W - 1),scalesW = outputSize[1] / W out(N,C,hdst,wdst)=self(N,C,hsrc,wsrc)out(N, C, h_{dst}, w_{dst}) = self(N, C, h_{src}, w_{src})
[object Object]

每个算子分为,必须先调用“aclnnUpsampleNearestExact2dGetWorkspaceSize”接口获取计算所需workspace大小以及包含了算子计算流程的执行器,再调用“aclnnUpsampleNearestExact2d”接口执行计算。

[object Object]
[object Object]
[object Object]
  • 参数说明

    [object Object]
    • [object Object]Atlas 推理系列产品[object Object]:

      参数self、out的数据类型仅支持FLOAT32、FLOAT16。

  • 返回值

    aclnnStatus:返回状态码,具体参见

    第一段接口完成入参校验,出现以下场景时报错:

    [object Object]
[object Object]
  • 参数说明

    [object Object]
  • 返回值

    aclnnStatus:返回状态码,具体参见

[object Object]
  • Atlas 350 加速卡:

    参数[object Object][object Object]的shape约束:

    • 每个维度的取值小于等于2^20。
    • 参数[object Object]的N轴和C轴与[object Object]保持一致。
    • 内存占用需小于60G。内存占用的计算公式如下:N(ceil(C/16)16)(self_Hself_W+out_Hout_W)sizeof(dtype)<60102410241024N * (ceil(C/16) * 16) * (self\_H * self\_W + out\_H * out\_W) * sizeof(dtype) < 60 * 1024 * 1024 * 1024 其中:
      • N代表输入和输出的N轴。
      • C代表输入和输出的C轴。
  • 参数self、outputSize、scalesH、scalesW需要满足如下约束:

    outputSize_H=floor(self_HscalesH)outputSize\_H = floor(self\_H * scalesH) outputSize_W=floor(self_WscalesW)outputSize\_W = floor(self\_W * scalesW)
  • 确定性计算:

    • aclnnUpsampleNearestExact2d默认确定性实现。
[object Object]

示例代码如下,仅供参考,具体编译和执行过程请参考

[object Object]