昇腾社区首页
中文
注册
开发者
下载

aclnnUpsampleBicubic2dAA

产品支持情况

[object Object]undefined

功能说明

  • 接口功能:对由多个输入通道组成的输入信号应用双三次抗锯齿算法进行上采样。如果输入Tensor x的shape为(N, C, H, W) ,则输出Tensor out的shape为(N, C, outputSize[0], outputSize[1])。

  • 计算公式:对于一个二维插值点(N,C,h,w)(N, C, h, w),插值out(N,C,h,w)out(N, C, h, w)可以表示为:

    out(N,C,h,w)=i=0kWj=0kHW(i,j)f(hi,wj){out(N, C, h, w)}=\sum_{i=0}^{kW}\sum_{j=0}^{kH}{W(i, j)}*{f(h_i, w_j)} scaleH={(x.dim(2)1)/(outputSize[0]1)alignCorners=true1/scalesHalignCorners=false&scalesH>0x.dim(2)/outputSize[0]otherwisescaleH =\begin{cases} (x.dim(2)-1) / (outputSize[0]-1) & alignCorners=true \\ 1 / scalesH & alignCorners=false\&scalesH>0\\ x.dim(2) / outputSize[0] & otherwise \end{cases} scaleW={(x.dim(3)1)/(outputSize[1]1)alignCorners=true1/scalesWalignCorners=false&scalesW>0x.dim(3)/outputSize[1]otherwisescaleW =\begin{cases} (x.dim(3)-1) / (outputSize[1]-1) & alignCorners=true \\ 1 / scalesW & alignCorners=false\&scalesW>0\\ x.dim(3) / outputSize[1] & otherwise \end{cases}

    其中:

    • i和j是W(i,j)W(i, j)的索引变量。
    • 如果scaleH>=1scaleH >= 1,则kH=1/scaleHkH = 1/scaleH,否则kH=4kH = 4
    • 如果scaleW>=1scaleW >= 1,则kW=1/scaleWkW = 1/scaleW,否则kW=4kW = 4
    • hi=h+ih_i = |h| + i
    • wj=w+jw_j = |w| + j
    • f(hi,wj)f(h_i, w_j)是原图像在(hi,wj)(h_i, w_j)的像素值
    • W(i,j)W(i, j)是双三次抗锯齿插值的权重,定义为:W(d)={(a+2)d3(a+3)d2+1d1ad35ad2+8ad4a1<d<20otherwiseW(d) =\begin{cases} (a+2)|d|^3-(a+3)|d|^2+1 & |d|\leq1 \\ a|d|^3-5a|d|^2+8a|d|-4a & 1<|d|<2 \\ 0 & otherwise \end{cases} 其中:
      • 抗锯齿场景a=0.5a=-0.5
      • d=(h,w)(hi,wj)d = |(h, w) - (h_i, w_j)|

函数原型

每个算子分为,必须先调用“aclnnUpsampleBicubic2dAAGetWorkspaceSize”接口获取计算所需workspace大小以及包含了算子计算流程的执行器,再调用“aclnnUpsampleBicubic2dAA”接口执行计算。

[object Object]
[object Object]

aclnnUpsampleBicubic2dAAGetWorkspaceSize

  • 参数说明

    [object Object]
  • 返回值

    aclnnStatus:返回状态码,具体参见

    第一段接口完成入参校验,出现以下场景时报错:

    [object Object]

aclnnUpsampleBicubic2dAA

  • 参数说明

    [object Object]
  • 返回值

    aclnnStatus:返回状态码,具体参见

约束说明

  • 参数[object Object][object Object]的shape约束:

    • 每个维度的取值小于等于2^20。
    • 参数[object Object]的N轴和C轴与[object Object]保持一致,且C轴、H轴、W轴大于0。
    • 内存占用需小于60G。内存占用的计算公式如下:(x_Hx_W+out_Hout_W+x_Hout_W)NCsizeof(float)<60102410241024(x\_H * x\_W + out\_H * out\_W + x\_H * out\_W) * N * C * sizeof(float) < 60 * 1024 * 1024 * 1024 其中:
      • N代表输入和输出的N轴。
      • C代表输入和输出的C轴。
    • N * C * x_H < 2^31
  • 输入数据缩放场景缩小倍数必须小于等于50,即:

    输入shape的高度H/outputSize_H<=50输入shape的高度H/outputSize\_H <= 50 输入shape的宽度W/outputSize_W<=50输入shape的宽度W/outputSize\_W <=50
  • 参数x、outputSize、scalesH、scalesW需要满足如下约束:

    outputSize_H=floor(x_HscalesH)outputSize\_H = floor(x\_H * scalesH) outputSize_W=floor(x_WscalesW)outputSize\_W = floor(x\_W * scalesW)
  • 确定性计算:

    • aclnnUpsampleBicubic2dAA默认确定性实现。

调用示例

示例代码如下,仅供参考,具体编译和执行过程请参考

[object Object]