aclnnCalculateMatmulWeightSizeV2-NN算子接口-算子加速库接口-CANN社区版8.0.RC3.alpha003开发文档-昇腾社区

[object Object][object Object]

[object Object]

[object Object]

[object Object]

算子功能：在Matmul算子ND格式输入下，计算如果要转换到NZ格式下需要占用的空间大小（单位为元素个数），仅支持Float16, INT8数据类型，该接口仅仅用于判断对weight Tensor进行预处理需要使用多少size才可使Matmul算子执行性能最优。输入tensorShape最少是2维（n，k），最多是6维（batch，n，k）。例如：

输入【510， 510】Float16 该函数出于性能角度考虑，会将shape变化为【512，512】因此函数会将引用输入修改为262144

输入【510， 270】INT8 该函数出于性能角度考虑，会将shape变化为【512，288】因此函数会将引用输入修改为147456
计算公式
$Float16: result = Align(Shapesize[0], 16) * Align(Shapesize[1], 16)$ $INT8： result = Align(Shapesize[0], 16) * Align(Shapesize[1], 32)$

[object Object]

参数说明：
- tensorShape(const aclIntArray *, 计算输入)：用于表达该次Matmul载入权重矩阵的Shape, 输入shape最少是2维（n，k），最多是6维（batch，n，k）。
- weightDtype(op::DataType *, 计算输入)：weight的Dtype, 支持Float16、INT8。
- weightTensorSize(uint64_t *, 计算输出)：转换为NZ格式所占用的空间大小（单位为元素个数）。
返回值：

aclnnStatus：返回状态码，具体参见。

[object Object]

[object Object]

[object Object]