接口功能:完成量化的分组矩阵计算,然后所有组的矩阵计算结果相加后输出。
计算公式:
每个算子分为,必须先调用“aclnnQuantMatmulReduceSumWeightNzGetWorkspaceSize”接口获取计算所需workspace大小以及包含了算子计算流程的执行器,再调用“aclnnQuantMatmulReduceSumWeightNz”接口执行计算。
[object Object]
[object Object]
- 确定性说明:
- aclnnQuantMatmulReduceSumWeightNz默认非确定性实现,支持通过aclrtCtxSetSysParamOpt开启确定性。
[object Object]