aclnnDynamicBlockQuant
产品支持情况
功能说明
接口功能:对输入张量,通过给定的rowBlockSize和colBlockSize将输入划分成多个数据块,以数据块为基本粒度进行量化。在每个块中,先计算出当前块对应的量化参数scaleOut,并根据scaleOut对输入进行量化。输出最终的量化结果,以及每个块的量化参数scaleOut。
计算公式:
其中block_reduce_max代表求每个block中的最大值。
函数原型
每个算子分为,必须先调用“aclnnDynamicBlockQuantGetWorkspaceSize”接口获取计算所需workspace大小以及包含了算子计算流程的执行器,再调用“aclnnDynamicBlockQuant”接口执行计算。
[object Object]
[object Object]
aclnnDynamicBlockQuantGetWorkspaceSize
参数说明:
[object Object]- [object Object]Atlas A2 训练系列产品/Atlas A2 推理系列产品[object Object]、[object Object]Atlas A3 训练系列产品/Atlas A3 推理系列产品[object Object]:
- 参数
[object Object]的值只支持0。 - 参数
[object Object]只支持rint。 - 参数
[object Object]仅支持取值2,代表ACL_INT8。 - 参数
[object Object]仅支持取值1。 - 参数
[object Object]的数据类型仅支持INT8。
- 参数
- [object Object]Atlas A2 训练系列产品/Atlas A2 推理系列产品[object Object]、[object Object]Atlas A3 训练系列产品/Atlas A3 推理系列产品[object Object]:
返回值:
第一段接口完成入参校验,出现以下场景时报错:
[object Object]
aclnnDynamicBlockQuant
约束说明
- 确定性计算:
- aclnnDynamicBlockQuant默认确定性实现。
调用示例
[object Object]Atlas A2 训练系列产品/Atlas A2 推理系列产品[object Object]、[object Object]Atlas A3 训练系列产品/Atlas A3 推理系列产品[object Object]:
[object Object]