aclnnFastLayerNorm
产品支持情况
功能说明
接口功能:对指定层进行均值为0、标准差为1的归一化计算。aclnnFastLayerNorm接口相比aclnnLayerNorm接口,整体性能提升了50%,内存与GPU保持一致,累加序优化导致精度存在差异。
计算公式:
其中,E[x]表示输入的均值,Var[x]表示输入的方差。
函数原型
每个算子分为,必须先调用“aclnnFastLayerNormGetWorkspaceSize”接口获取计算所需workspace大小以及包含了算子计算流程的执行器,再调用“aclnnFastLayerNorm”接口执行计算。
[object Object]
[object Object]
aclnnFastLayerNormGetWorkspaceSize
aclnnFastLayerNorm
约束说明
- input、normalizedShape、weightOptional(非空时)、biasOptional(非空时)、out、meanOutOptional(非空时)或rstdOutOptional(非空时)的shape不超过8维。
- 确定性计算:
- aclnnFastLayerNorm默认确定性实现。
调用示例
[object Object]