aclnnConvertWeightToINT4Pack

产品支持情况

[object Object]undefined

功能说明

对输入weight数据做预处理，实现低比特数据由稀疏存储到紧密存储的排布转换。输出weightInt4Pack的声明为FRACTAL_NZ时，该算子将从ND转为FRACTAL_NZ。

[object Object]Atlas A2 训练系列产品/Atlas A2 推理系列产品[object Object]、[object Object]Atlas A3 训练系列产品/Atlas A3 推理系列产品[object Object]：将INT32类型的weight输入数据打包为紧密排布的INT4数据。

函数原型

每个算子分为，必须先调用“aclnnConvertWeightToINT4PackGetWorkspaceSize”接口获取计算所需workspace大小以及包含了算子计算流程的执行器，再调用“aclnnConvertWeightToINT4Pack”接口执行计算。

[object Object]

[object Object]

aclnnConvertWeightToINT4PackGetWorkspaceSize

参数说明
[object Object]
返回值：

aclnnStatus：返回状态码，具体参见。

第一段接口完成入参校验，出现以下场景时报错：
[object Object]

aclnnConvertWeightToINT4Pack

参数说明
[object Object]
返回值：

aclnnStatus：返回状态码，具体参见。

约束说明

确定性说明：
- [object Object]Atlas 训练系列产品[object Object]、[object Object]Atlas 推理系列产品[object Object]：aclnnConvertWeightToINT4Pack默认确定性实现。

参数间数据类型、数据格式间关系如下：

[object Object]Atlas A2 训练系列产品/Atlas A2 推理系列产品[object Object]、[object Object]Atlas A3 训练系列产品/Atlas A3 推理系列产品[object Object]：[object Object]

调用示例

[object Object]Atlas A2 训练系列产品/Atlas A2 推理系列产品[object Object]、[object Object]Atlas A3 训练系列产品/Atlas A3 推理系列产品[object Object]：示例代码如下，仅供参考，具体编译和执行过程请参考。伪量化有aclnnWeightQuantBatchMatmulV2和aclnnWeightQuantBatchMatmulV3接口，这里以aclnnWeightQuantBatchMatmulV2为例。

[object Object]