aclnnSwiGluQuant
产品支持情况
功能说明
接口功能:在SwiGlu激活函数后添加quant操作,实现输入x的SwiGluQuant计算
算子支持范围:当前SwiGluQuant仅支持MoE场景,SwiGluQuant的输入x和group_index来自于GroupedMatMul算子和MoeInitRouting的输出,通过group_index入参实现MoE分组动态量化、静态per_tensor量化、静态per_channel量化功能。
动态量化计算公式:
其中,A表示输入x的前半部分,B表示输入x的后半部分,g表示group_index,G为group_index的分组数量。
静态量化计算公式:
其中,A表示输入x的前半部分,B表示输入x的后半部分,g表示group_index,G为group_index的分组数量。
函数原型
每个算子分为,必须先调用“aclnnSwiGluQuantGetWorkspaceSize”接口获取计算所需workspace大小以及包含了算子计算流程的执行器,再调用“aclnnSwiGluQuant”接口执行计算。
[object Object]
[object Object]
aclnnSwiGluQuantGetWorkspaceSize
aclnnSwiGluQuant
约束说明
- 确定性计算:
- aclnnSwiGluQuant默认确定性实现。
调用示例
[object Object]