aclnnUpsampleBilinear2d
产品支持情况
产品 | 是否支持 |
---|---|
[object Object]Atlas A3 训练系列产品/Atlas A3 推理系列产品[object Object] | √ |
[object Object]Atlas A2 训练系列产品/Atlas 800I A2 推理产品/A200I A2 Box 异构组件[object Object] | √ |
[object Object]Atlas 200I/500 A2 推理产品[object Object] | × |
[object Object]Atlas 推理系列产品 [object Object] | √ |
[object Object]Atlas 训练系列产品[object Object] | √ |
功能说明
- 算子功能:对由多个输入通道组成的输入信号应用2D双线性上采样。
- 对于输入shape:如果输入shape为(N,C,H,W),则输出shape为(N,C,outputSize[0],outputSize[1])。
- 对于中心对齐的选择:一般像素被视为网格。当alignCorners = True时,像素被视为网格左上角的点,输出拐角处的像素与原图像的拐角像素中心对齐,同方向点之间是等间距的;当alignCorners = False时, 像素被视为网格的交叉线上的点,输出拐角处的像素依然是原图像的拐角像素,但同方向点之间是不等距的。
- 示例:(1,1,3,3) -> (1,1,5,5)
函数原型
每个算子分为undefined,必须先调用“aclnnUpsampleBilinear2dGetWorkspaceSize”接口获取计算所需workspace大小以及包含了算子计算流程的执行器,再调用“aclnnUpsampleBilinear2d”接口执行计算。
aclnnStatus aclnnUpsampleBilinear2dGetWorkspaceSize(const aclTensor *self, const aclIntArray *outputSize, const bool alignCorners, const double scalesH, const double scalesW, aclTensor *out, uint64_t *workspaceSize, aclOpExecutor **executor)
aclnnStatus aclnnUpsampleBilinear2d(void *workspace, uint64_t workspaceSize, aclOpExecutor *executor, aclrtStream stream)
aclnnUpsampleBilinear2dGetWorkspaceSize
参数说明:
- self(aclTensor*,计算输入):Device侧的aclTensor,表示进行上采样的输入张量。支持undefined,shape仅支持4维,undefined支持NCHW和NHWC。当数据类型为DOUBLE时,仅支持NHWC格式。
- [object Object]Atlas 推理系列产品[object Object]、[object Object]Atlas 训练系列产品[object Object]:数据类型支持FLOAT、FLOAT16、DOUBLE。
- [object Object]Atlas A2 训练系列产品/Atlas 800I A2 推理产品/A200I A2 Box 异构组件[object Object]、[object Object]Atlas A3 训练系列产品/Atlas A3 推理系列产品[object Object]:数据类型支持FLOAT、BFLOAT16、FLOAT16、DOUBLE。
- outputSize(aclIntArray*,计算输入):Host侧的aclIntArray,输出空间大小。size大小为2,表示指定
out
在H和W维度上的空间大小。 - alignCorners(bool,计算输入):Host侧的bool类型参数。如果设置为True,则输入和输出张量按其角像素的中心点对齐,保留角像素处的值;如果设置为False,则输入和输出张量通过其角像素的角点对齐,并使用边缘值对边界外的值进行填充。
- scalesH(double,计算输入):Host侧的double常量,空间大小的height维度乘数,不能传入负值。
- scalesW(double,计算输入):Host侧的double常量,空间大小的width维度乘数,不能传入负值。
- out(aclTensor*,计算输出):Device侧的aclTensor,表示采样后的输出张量。shape仅支持4维,且N轴和C轴与输入self shape的N轴和C轴保持一致;当outputSize输入的值有效时,H轴和W轴与参数outputSize对应轴的值保持一致;当outputSize输入的值不生效时(不生效的场景请参见undefined),H轴和W轴与计算后得到的outputSize对应轴的值保持一致。支持undefined,undefined支持NCHW和NHWC。当数据类型为DOUBLE时,仅支持NHWC格式。数据类型和数据格式与入参
self
的数据类型和数据格式保持一致。- [object Object]Atlas 推理系列产品[object Object]、[object Object]Atlas 训练系列产品[object Object]:数据类型支持FLOAT、FLOAT16、DOUBLE。
- [object Object]Atlas A2 训练系列产品/Atlas 800I A2 推理产品/A200I A2 Box 异构组件[object Object]、[object Object]Atlas A3 训练系列产品/Atlas A3 推理系列产品[object Object]:数据类型支持FLOAT、BFLOAT16、FLOAT16、DOUBLE。
- workspaceSize(uint64_t*,出参):返回需要在Device侧申请的workspace大小。
- executor(aclOpExecutor**,出参):返回op执行器,包含了算子计算流程。
- self(aclTensor*,计算输入):Device侧的aclTensor,表示进行上采样的输入张量。支持undefined,shape仅支持4维,undefined支持NCHW和NHWC。当数据类型为DOUBLE时,仅支持NHWC格式。
返回值:
aclnnStatus:返回状态码,具体参见undefined。
[object Object]
aclnnUpsampleBilinear2d
- 参数说明:
- workspace(void*,入参):在Device侧申请的workspace内存地址。
- workspaceSize(uint64_t,入参):在Device侧申请的workspace大小,由第一段接口aclnnUpsampleBilinear2dGetWorkspaceSize获取。
- executor(aclOpExecutor*,入参):op执行器,包含了算子计算流程。
- stream(aclrtStream,入参):指定执行任务的Stream。
- 返回值:
aclnnStatus:返回状态码,具体参见undefined。
约束说明
- 当alignCorners为True时,参数outputSize与参数scalesH和参数scalesW,在使用时二选一,即:
- outputSize对应轴的值小于等于1,scales对应轴的值为0。
- 其他情况下使用入参self和outputSize中对应轴的参数值,且:。
- 当alignCorners为False时:
- 当入参scalesH或入参scalesW的值等于0时,使用入参outputSize的参数值。
- 当outputSize对应轴等于0,即对应的scales为0。
- 当outputSize的对应轴不等于0时,即:。
- 当入参scalesH和入参scalesW的值都大于0时,使用入参scalesH、scalesW和outputSize输入的参数值。
- 当入参scalesH或入参scalesW的值等于0时,使用入参outputSize的参数值。
调用示例
示例代码如下,仅供参考,具体编译和执行过程请参考undefined。
[object Object]