整体约束和接口列表

整体约束

接口列表

分类

接口名称

功能描述

训练后量化接口

create_quant_config

根据图的结构找到所有可量化的层,自动生成量化配置文件,并将可量化层的量化配置信息写入文件。

quantize_model

将输入的待量化的图结构按照给定的量化配置文件进行量化处理,在传入的图结构中插入权重量化,以及数据量化等相关的算子,生成量化因子记录文件record_file,返回修改后的ONNX校准模型。

save_model

根据量化因子记录文件record_file以及修改后的模型,调用该接口,插入AscendQuant、AscendDequant等算子,然后保存为可以在ONNX Runtime环境进行精度仿真的fake_quant模型,和可以在昇腾AI处理器做推理的deploy模型。

accuracy_based_auto_calibration

根据用户输入的模型、配置文件进行自动的校准过程,搜索得到一个满足目标精度的量化配置,输出可以在ONNX Runtime环境下做精度仿真的fake_quant模型,和可在昇腾AI处理器上做推理的deploy模型。

quantize_preprocess

量化数据均衡预处理接口,将输入的待量化的图结构按照给定的量化配置文件进行训练后量化预处理,在传入的图结构中插入均衡量化算子,生成均衡量化因子记录文件record_file,返回修改后的ONNX校准模型。

模型适配接口

convert_qat_model

将ONNX量化模型适配为CANN支持的量化模型。