- 接口功能 :LayerNorm算子是大模型常用的归一化操作。LayerNormQuant算子将LayerNorm归一化输出和下游的量化算子融合起来,减少搬入搬出操作。
- 计算公式:
LayerNorm操作:
quantMode为0时,量化模式为静态量化,输出scaleOut无实际意义:
quantMode为1时,量化模式为动态量化:
每个算子分为,必须先调用[object Object]接口获取入参并根据计算流程所需workspace大小,再调用[object Object]接口执行计算。
[object Object]
[object Object]
- 确定性计算:
- aclnnLayerNormQuant默认确定性实现。
[object Object]