aclnnAddRmsNorm
产品支持情况
功能说明
- 算子功能:RmsNorm算子是大模型常用的归一化操作,相比LayerNorm算子,其去掉了减去均值的部分。AddRmsNorm算子将RmsNorm前的Add算子融合起来,减少搬入搬出操作。
- 计算公式:
函数原型
每个算子分为,必须先调用[object Object]接口获取入参并根据计算流程所需workspace大小,再调用[object Object]接口执行计算。
[object Object][object Object]
aclnnAddRmsNormGetWorkspaceSize
参数说明:
- x1(aclTensor*,计算输入):用于Add计算的第一个输入。Device侧的aclTensor,对应公式中的
[object Object],shape支持1-8维度,支持ND。支持,不支持空Tensor。- [object Object]Atlas 推理系列产品[object Object]:数据类型支持FLOAT32、FLOAT16。
- [object Object]Atlas A2 训练系列产品/Atlas A2 推理系列产品[object Object]、[object Object]Atlas A3 训练系列产品/Atlas A3 推理系列产品[object Object]:数据类型支持FLOAT32、FLOAT16、BFLOAT16。
- x2(aclTensor*,计算输入):用于Add计算的第二个输入。Device侧的aclTensor,对应公式中的
[object Object],shape支持1-8维度,支持ND。shape和数据类型需要与[object Object]的shape和数据类型保持一致。支持,不支持空Tensor。- [object Object]Atlas 推理系列产品[object Object]:数据类型支持FLOAT32、FLOAT16。
- [object Object]Atlas A2 训练系列产品/Atlas A2 推理系列产品[object Object]、[object Object]Atlas A3 训练系列产品/Atlas A3 推理系列产品[object Object]:数据类型支持FLOAT32、FLOAT16、BFLOAT16。
- gamma(aclTensor*,计算输入):表示RmsNorm的缩放因子(权重),Device侧的aclTensor,对应公式中的
[object Object],shape支持1-8维度,支持ND。shape需要与[object Object]后几维保持一致,后几维为x1需要Norm的维度。数据类型与[object Object]的数据类型保持一致。支持,不支持空Tensor。- [object Object]Atlas 推理系列产品[object Object]:数据类型支持FLOAT32、FLOAT16。
- [object Object]Atlas A2 训练系列产品/Atlas A2 推理系列产品[object Object]、[object Object]Atlas A3 训练系列产品/Atlas A3 推理系列产品[object Object]:数据类型支持FLOAT32、FLOAT16、BFLOAT16。
- epsilon(double,计算输入):Host侧的aclTensor,公式中的输入
[object Object],用于防止除0错误,建议值为1e-6。 - yOut(aclTensor*,计算输出):表示最后的输出,Device侧的aclTensor,对应公式中的
[object Object],支持1-8维度,shape、数据类型与输入[object Object]的shape、数据类型保持一致,支持ND。支持,不支持空Tensor。- [object Object]Atlas 推理系列产品[object Object]:数据类型支持FLOAT32、FLOAT16。
- [object Object]Atlas A2 训练系列产品/Atlas A2 推理系列产品[object Object]、[object Object]Atlas A3 训练系列产品/Atlas A3 推理系列产品[object Object]:数据类型支持FLOAT32、FLOAT16、BFLOAT16。
- rstdOut(aclTensor*,计算输出):表示归一化后的标准差,Device侧的aclTensor,对应公式中的
[object Object],数据类型支持FLOAT32,支持ND,支持,不支持空Tensor。shape支持1-8维度,shape与[object Object]前几维保持一致,前几维表示不需要norm的维度。rstdOutshape与x1shape,gammashape关系举例:若x1shape:(2,3,4,8),gammashape:(8),rstdOutshape(2,3,4,1);若x1shape:(2,3,4,8),gammashape:(4,8),rstdOutshape(2,3,1,1)。- [object Object]Atlas 推理系列产品[object Object]:该场景下输出无效。
- xOut(aclTensor*,计算输出):表示Add计算的结果,Device侧的aclTensor,对应公式中的
[object Object],shape支持1-8维度,shape、数据类型与输入[object Object]的shape、数据类型保持一致,支持ND。支持,不支持空Tensor。- [object Object]Atlas 推理系列产品[object Object]:数据类型支持FLOAT32、FLOAT16。
- [object Object]Atlas A2 训练系列产品/Atlas A2 推理系列产品[object Object]、[object Object]Atlas A3 训练系列产品/Atlas A3 推理系列产品[object Object]:数据类型支持FLOAT32、FLOAT16、BFLOAT16。
- workspaceSize(uint64_t*,出参):返回用户需要在Device侧申请的workspace大小。
- executor(aclOpExecutor**,出参):返回op执行器,包含了算子计算流程。
- x1(aclTensor*,计算输入):用于Add计算的第一个输入。Device侧的aclTensor,对应公式中的
返回值:
[object Object]
aclnnAddRmsNorm
参数说明:
- workspace(void*,入参):在Device侧申请的workspace内存地址。
- workspaceSize(uint64_t,入参):在Device侧申请的workspace大小,由第一段接口aclnnAddRmsNormGetWorkspaceSize获取。
- executor(aclOpExecutor*,入参):op执行器,包含了算子计算流程。
- stream(aclrtStream,入参):指定执行任务的Stream。
返回值:
约束说明
边界值场景说明
- 当输入是inf时,输出为inf。
- 当输入是nan时,输出为nan。
调用示例
[object Object]