- 接口功能 :LayerNorm算子是大模型常用的归一化操作。LayerNormQuant算子将LayerNorm归一化输出和下游的量化算子融合起来,减少搬入搬出操作。
- 计算公式:
LayerNorm操作:
quantMode为0时,量化模式为静态量化,输出scaleOut无实际意义:
quantMode为1时,量化模式为动态量化:
每个算子分为,必须先调用[object Object]接口获取入参并根据计算流程所需workspace大小,再调用[object Object]接口执行计算。
[object Object]
[object Object]
参数说明
[object Object][object Object]Atlas A3 训练系列产品/Atlas A3 推理系列产品[object Object]、[object Object]Atlas A2 训练系列产品/Atlas A2 推理系列产品[object Object]:
入参
[object Object]、[object Object]、[object Object]、[object Object]的数据类型不支持FLOAT32。[object Object]Atlas 推理系列产品[object Object]:
- 入参
[object Object]、[object Object]、[object Object]、[object Object]的数据类型仅支持FLOAT16。 - 入参
[object Object]、[object Object]、[object Object]的尾轴长度必须大于等于32Bytes。
- 入参
返回值
第一段接口完成入参校验,出现以下场景时报错:
[object Object]
- 确定性计算:
- aclnnLayerNormQuant默认确定性实现。
[object Object]