aclnnInstanceNorm

产品支持情况

产品	是否支持
[object Object]Atlas A3 训练系列产品/Atlas A3 推理系列产品[object Object]	×
[object Object]Atlas A2 训练系列产品/Atlas 800I A2 推理产品/A200I A2 Box 异构组件[object Object]	×
[object Object]Atlas 200I/500 A2 推理产品[object Object]	×
[object Object]Atlas 推理系列产品 [object Object]	√
[object Object]Atlas 训练系列产品[object Object]	×

功能说明

算子功能：用于执行Instance Normalization（实例归一化）操作。与undefined相比，aclnnInstanceNorm在每个样本的实例上进行归一化，而不是在整个批次上进行归一化，这使得该函数更适合处理图像等数据。
计算公式： $y = {{x-E(x)}\over\sqrt {Var(x)+eps}} * \gamma + \beta$

函数原型

每个算子分为undefined，必须先调用aclnnInstanceNormGetWorkspaceSize接口获取入参并根据计算流程所需workspace大小，再调用aclnnInstanceNorm接口执行计算。

aclnnStatus aclnnInstanceNormGetWorkspaceSize(const aclTensor *x, const aclTensor *gamma, const aclTensor *beta, const char *dataFormat, double eps, aclTensor *y, aclTensor *mean, aclTensor *variance, uint64_t *workspaceSize, aclOpExecutor **executor)
aclnnStatus aclnnInstanceNorm(void *workspace, uint64_t workspaceSize, aclOpExecutor *executor, aclrtStream stream)

aclnnInstanceNormGetWorkspaceSize

参数说明：
- x（aclTensor *，计算输入）：表示进行InstanceNorm计算的输入数据，公式中的x。Device侧的aclTensor，tensor维度为4维。数据类型支持FLOAT、FLOAT16。支持undefined，支持空Tensor。undefined支持ND，实际数据格式由参数dataFormat决定。
- gamma（aclTensor *，计算输入）：表示进行InstanceNorm计算的缩放因子（权重），公式中的 $\gamma$ 。Device侧的aclTensor，tensor维度为1维，且shape和输入x的C轴一致。数据类型支持FLOAT、FLOAT16，和输入x保持一致。支持undefined，支持空Tensor。undefined支持ND。
- beta（aclTensor *，计算输入）：表示进行InstanceNorm计算的偏置，公式中的 $\beta$ 。Device侧的aclTensor，tensor维度为1维，且shape和输入x的C轴一致。数据类型支持FLOAT、FLOAT16，和输入x保持一致。支持undefined，支持空Tensor。undefined支持ND。
- dataFormat（char *，计算输入）：Host侧的aclTensor，算子输入Tensor的实际数据排布，可以是NHWC或NCHW。
- eps（double，计算输入）：Host侧的aclTensor，对应InstanceNorm计算公式中eps，添加到分母中的值，用于防止除零错误，以确保数值稳定。
- y（aclTensor *，计算输出）：表示InstanceNorm的输出结果，对应公式中的y。Device侧的aclTensor，数据类型支持FLOAT、FLOAT16，且数据类型与x一致。shape需要与x一致，undefined支持ND。支持undefined，支持空Tensor。
- mean（aclTensor *，计算输出）：表示InstanceNorm的均值，对应公式中的E(x)。Device侧的aclTensor，tensor维度为4维，shape与输入x满足undefined（前2维的shape和输入x前2维的shape相同，前2维表示不需要norm的维度，其余维度大小为1）。数据类型支持FLOAT、FLOAT16，且和输入x保持一致。undefined支持ND。支持undefined，支持空Tensor。
- variance（aclTensor *，计算输出）：表示InstanceNorm的方差，对应公式中的Var(x)。Device侧的aclTensor，tensor维度为4维，shape与输入x满足undefined（前2维的shape和输入x前2维的shape相同，前2维表示不需要norm的维度，其余维度大小为1）。数据类型支持FLOAT、FLOAT16，且和输入x保持一致。undefined支持ND。支持undefined，支持空Tensor。
- workspaceSize（uint64_t *，出参）：返回用户需要在Device侧申请的workspace大小。
- executor（aclOpExecutor **，出参）：返回op执行器，包含了算子计算流程。
返回值：

aclnnStatus：返回状态码。（参见undefined）

[object Object]

aclnnInstanceNorm

参数说明：
- workspace（void *，入参）：在Device侧申请的workspace内存地址。
- workspaceSize（uint64_t，入参）：在Device侧申请的workspace大小，由第一段接口aclnnInstanceNormGetWorkspaceSize获取。
- executor（aclOpExecutor *，入参）：op执行器，包含了算子计算流程。
- stream（aclrtStream，入参）：指定执行任务的Stream。
返回值：

aclnnStatus：返回状态码。（具体参见undefined）

约束说明

功能维度
- 数据类型支持
  - x，gamma，beta，y，mean，variance支持：FLOAT32、FLOAT16。
- 数据格式支持：ND。
- x，y的shape要求4维，gamma/beta的维度要求1维，且和x，y的C轴一致。
- x，y的H*W大小需要大于32Bytes，且C轴大于32Bytes。
- 参数dataFormat仅支持"NHWC"和"NCHW"。
边界值场景说明
- 当输入是inf时，输出为inf。
- 当输入是nan时，输出为nan。

调用示例

示例代码如下，仅供参考，具体编译和执行过程请参考undefined。

[object Object]