- 接口功能:对张量x进行旋转变换,再执行对称动态量化。
- 计算公式:
旋转变换
其中:,,。
对称动态量化(pertoken 逐行量化)
- 缩放因子计算(逐行计算) 其中: 是第 行的缩放因子; 是量化范围最大值,int8 取127,quint4x2 取7。
- 量化计算
每个算子分为,必须先调用“aclnnRotateQuantGetWorkspaceSize”接口获取入参并根据流程计算所需workspace大小,再调用“aclnnRotateQuant”接口执行计算。
[object Object]
[object Object]
- [object Object]Atlas A3 训练系列产品/Atlas A3 推理系列产品[object Object]、[object Object]Atlas A2 训练系列产品/Atlas A2 推理系列产品[object Object]:
- x的shape为(M, N),rotation的shape为(K, K)。
- rotation的shape必须是方阵(K, K)。
- x第二维的长度(N)必须是K的整数倍,N必须可以整除8。
- 当yOut的输出类型为int8时,y的shape必须和x相同(M, N)。
- 当yOut的输出类型为int32时,y的shape必须为(M, N//8)。
- x和rotation的数据类型必须相同。
- scaleOut的shape必须是(M)。
- N的范围为[128, 16000]。
- K的范围为[16, 1024]。
[object Object]