昇腾社区首页
中文
注册
开发者
下载

aclnnUpsampleBicubic2dAA

产品支持情况

[object Object]undefined

功能说明

  • 接口功能:对由多个输入通道组成的输入信号应用双三次抗锯齿算法进行上采样。如果输入Tensor x的shape为(N, C, H, W) ,则输出Tensor out的shape为(N, C, outputSize[0], outputSize[1])。
  • 计算公式:对于一个二维插值点(N,C,h,w)(N, C, h, w),插值out(N,C,h,w)out(N, C, h, w)可以表示为:out(N,C,h,w)=i=0kWj=0kHW(i,j)f(hi,wj){out(N, C, h, w)}=\sum_{i=0}^{kW}\sum_{j=0}^{kH}{W(i, j)}*{f(h_i, w_j)} scaleH={(x.dim(2)1)/(outputSize[0]1)alignCorners=true1/scalesHalignCorners=false&scalesH>0x.dim(2)/outputSize[0]otherwisescaleH =\begin{cases} (x.dim(2)-1) / (outputSize[0]-1) & alignCorners=true \\ 1 / scalesH & alignCorners=false\&scalesH>0\\ x.dim(2) / outputSize[0] & otherwise \end{cases} scaleW={(x.dim(3)1)/(outputSize[1]1)alignCorners=true1/scalesWalignCorners=false&scalesW>0x.dim(3)/outputSize[1]otherwisescaleW =\begin{cases} (x.dim(3)-1) / (outputSize[1]-1) & alignCorners=true \\ 1 / scalesW & alignCorners=false\&scalesW>0\\ x.dim(3) / outputSize[1] & otherwise \end{cases} 其中:
    • i和j是W(i,j)W(i, j)的索引变量。
    • 如果scaleH>=1scaleH >= 1,则kH=1/scaleHkH = 1/scaleH,否则kH=4kH = 4
    • 如果scaleW>=1scaleW >= 1,则kW=1/scaleWkW = 1/scaleW,否则kW=4kW = 4
    • hi=h+ih_i = |h| + i
    • wj=w+jw_j = |w| + j
    • f(hi,wj)f(h_i, w_j)是原图像在(hi,wj)(h_i, w_j)的像素值
    • W(i,j)W(i, j)是双三次抗锯齿插值的权重,定义为:W(d)={(a+2)d3(a+3)d2+1d1ad35ad2+8ad4a1<d<20otherwiseW(d) =\begin{cases} (a+2)|d|^3-(a+3)|d|^2+1 & |d|\leq1 \\ a|d|^3-5a|d|^2+8a|d|-4a & 1<|d|<2 \\ 0 & otherwise \end{cases} 其中:
      • 抗锯齿场景a=0.5a=-0.5
      • d=(h,w)(hi,wj)d = |(h, w) - (h_i, w_j)|

函数原型

每个算子分为,必须先调用“aclnnUpsampleBicubic2dAAGetWorkspaceSize”接口获取计算所需workspace大小以及包含了算子计算流程的执行器,再调用“aclnnUpsampleBicubic2dAA”接口执行计算。

[object Object]
[object Object]

aclnnUpsampleBicubic2dAAGetWorkspaceSize

  • 参数说明

    [object Object]
  • 返回值

    aclnnStatus:返回状态码,具体参见

    第一段接口完成入参校验,出现以下场景时报错:

    [object Object]

aclnnUpsampleBicubic2dAA

  • 参数说明

    [object Object]
  • 返回值

    aclnnStatus:返回状态码,具体参见

约束说明

  • 参数[object Object][object Object]的shape约束:
    • 每个维度的取值小于等于2^20。
    • 参数[object Object]的N轴和C轴与[object Object]保持一致,且C轴、H轴、W轴大于0。
    • 内存占用需小于60G。内存占用的计算公式如下:(x_Hx_W+out_Hout_W+x_Hout_W)NCsizeof(float)<60102410241024(x\_H * x\_W + out\_H * out\_W + x\_H * out\_W) * N * C * sizeof(float) < 60 * 1024 * 1024 * 1024 其中:
      • N代表输入和输出的N轴。
      • C代表输入和输出的C轴。
    • N * C * x_H < 2^31
  • 输入数据缩放场景缩小倍数必须小于等于50,即输入shape的高度H/outputSize[0]以及宽度W/outputSize[1]必须小于等于50。
  • 参数outputSize包含的元素个数必须为2,且和输出shape的H、W轴必须相同。
  • 参数outputSize的H轴和W轴与参数scalesH和参数scalesW,在使用时二选一,即:
    • 当alignCorners为True时:
      • outputSize对应轴的值小于等于1,scales对应轴的值为0。
      • 其他情况下使用入参x和outputSize中对应轴的参数值,且:scales=(x1)/(outputSize1)scales=(x-1)/(outputSize-1)
    • 当alignCorners为False时:
      • 当入参scalesH或入参scalesW的值小于等于0时,使用入参outputSize中对应轴的参数值。
        • 当outputSize对应轴等于0,即对应的scales为0。
        • 当outputSize的对应轴不等于0时,即:scales=(x/outputSize)scales=(x/outputSize)
      • 当入参scalesH或入参scalesW的值大于0时,使用入参scalesH或入参scalesW的参数值,即outputSize对应轴的值为floor(x_HscalesH)floor(x\_H * scalesH),或者floor(x_WscalesW)floor(x\_W * scalesW)
  • 确定性计算:
    • aclnnUpsampleBicubic2dAA默认确定性实现。

调用示例

示例代码如下,仅供参考,具体编译和执行过程请参考

[object Object]