接口功能:完成张量self与张量mat2的矩阵乘计算,mat2仅支持NZ格式,只支持self为3维,mat2为5维。
计算公式:
每个算子分为,必须先调用“aclnnBatchMatMulWeightNzGetWorkspaceSize”接口获取入参并根据流程计算所需workspace大小,再调用“aclnnBatchMatMulWeightNZ”接口执行计算。
[object Object]
[object Object]
确定性说明:
- aclnnBatchMatMulWeightNz默认确定性实现。
不支持两个输入分别为BFLOAT16和FLOAT16的数据类型推导。
self只支持3维, mat2只支持昇腾私有格式,调用此接口之前,必须完成mat2从ND到昇腾私有格式的转换。
不支持mat2最后两根轴其中一根轴为1,即k=1或者n=1。