aclnnSparse4to2QuantMatmulWeightNz
产品支持情况
功能说明
算子功能:
完成稀疏4:2量化的矩阵乘计算。
计算公式:
函数原型
每个算子分为,必须先调用“aclnnSparse4to2QuantMatmulGetWorkspaceSize”接口获取入参并根据计算流程计算所需workspace大小,再调用“aclnnSparse4to2QuantMatmul”接口执行计算。
[object Object]
[object Object]
aclnnSparse4to2QuantMatmulWeightNzGetWorkspaceSize
aclnnSparse4to2QuantMatmulWeightNz
约束说明
- x的最后一维即shape的描述中k的值不能超过65535。
- 当前只支持sparseWeightScale,xScale均不是nullptr的场景。
调用示例
[object Object]Atlas A2 训练系列产品/Atlas A2 推理系列产品[object Object]、[object Object]Atlas A3 训练系列产品/Atlas A3 推理系列产品[object Object]:
[object Object]