需要和、接口配套使用,用于创建一个对于Matmul算子计算性能亲和的weight Tensor。支持FLOAT16、BFLOAT16、 Int8数据类型。
每个算子分为,必须先调用“aclnnTransMatmulWeightGetWorkspaceSize”接口获取计算所需workspace大小以及包含了算子计算流程的执行器,再调用“aclnnTransMatmulWeight”接口执行计算。
[object Object]
[object Object]
参数说明
[object Object]- [object Object]Atlas 推理系列产品[object Object]、[object Object]Atlas 训练系列产品[object Object]:mmWeightRef数据类型不支持BFLOAT16。
返回值
第一段接口完成入参校验,出现以下场景时报错:
[object Object]
确定性计算:
- aclnnTransMatmulWeight默认确定性实现。
不支持cache缓存能力。
[object Object]