昇腾社区首页
中文
注册
开发者
下载

aclnnAddRmsNormDynamicQuant

产品支持情况

[object Object]undefined

功能说明

  • 接口功能:RmsNorm算子是大模型常用的归一化操作,相比LayerNorm算子,其去掉了减去均值的部分。DynamicQuant算子则是为输入张量进行对称动态量化的算子。AddRmsNormDynamicQuant算子将RmsNorm前的Add算子和RmsNorm归一化输出给到的1个或2个DynamicQuant算子融合起来,减少搬入搬出操作。
  • 计算公式:x=x1+x2x=x_{1}+x_{2} y=RmsNorm(x)=xRms(x)gamma, where Rms(x)=1ni=1nxi2+epsilony = \operatorname{RmsNorm}(x)=\frac{x}{\operatorname{Rms}(\mathbf{x})}\cdot gamma, \quad \text { where } \operatorname{Rms}(\mathbf{x})=\sqrt{\frac{1}{n} \sum_{i=1}^n x_i^2+epsilon}
    • 若smoothScale1Optional和smoothScale2Optional均不输入,则y2Out和scale2Out输出无实际意义。计算过程如下所示:
    scale1Out=row_max(abs(y))/127scale1Out=row\_max(abs(y))/127 y1Out=round(y/scale1Out)y1Out=round(y/scale1Out)
    • 若仅输入smoothScale1Optional,则y2Out和scale2Out输出无实际意义。计算过程如下所示:
    input=ysmoothScale1Optionalinput = y\cdot smoothScale1Optional scale1Out=row_max(abs(input))/127scale1Out=row\_max(abs(input))/127 y1Out=round(input/scale1Out)y1Out=round(input/scale1Out)
    • 若smoothScale1Optional和smoothScale2Optional均输入,则算子的五个输出均为有效输出。计算过程如下所示:
    input1=ysmoothScale1Optionalinput1 = y\cdot smoothScale1Optional input2=ysmoothScale2Optionalinput2 = y\cdot smoothScale2Optional scale1Out=row_max(abs(input1))/127scale1Out=row\_max(abs(input1))/127 scale2Out=row_max(abs(input2))/127scale2Out=row\_max(abs(input2))/127 y1Out=round(input1/scale1Out)y1Out=round(input1/scale1Out) y2Out=round(input2/scale2Out)y2Out=round(input2/scale2Out)

    其中row_max代表每行求最大值。

函数原型

每个算子分为,必须先调用[object Object]接口获取入参并根据计算流程所需workspace大小,再调用[object Object]接口执行计算。

[object Object]
[object Object]

aclnnAddRmsNormDynamicQuantGetWorkspaceSize

  • 参数说明

    [object Object]
    • [object Object]Atlas A3 训练系列产品/Atlas A3 推理系列产品[object Object]、[object Object]Atlas A2 训练系列产品/Atlas A2 推理系列产品[object Object]:
      • 出参[object Object][object Object]仅支持INT8。
  • 返回值:

    aclnnStatus:返回状态码,具体参见

    第一段接口完成入参校验,出现以下场景时报错:

    [object Object]

aclnnAddRmsNormDynamicQuant

  • 参数说明:

    [object Object]
  • 返回值:

    aclnnStatus:返回状态码。(具体参见

约束说明

  • 支持类型说明

    是否支持空Tensor:支持空进空出。

  • 数据格式说明

    所有输入输出Tensor的数据格式推荐使用ND格式,其他数据格式会由框架默认转换成ND格式进行处理。

  • 各产品型号支持数据类型说明

    • [object Object]Atlas A3 训练系列产品/Atlas A3 推理系列产品[object Object]、[object Object]Atlas A2 训练系列产品/Atlas A2 推理系列产品[object Object]:[object Object]undefined
  • 确定性计算:

    • aclnnAddRmsNormDynamicQuant默认确定性实现。

调用示例

示例代码如下,仅供参考,具体编译和执行过程请参考

[object Object]