QuantConfig

功能说明

量化参数配置类，保存量化过程中配置的参数。

函数原型

QuantConfig(quant_mode=1, is_signed_quant=True, is_per_channel=True, calib_data=None, calib_method=0, quantize_nodes=None, exclude_nodes=None, amp_num=0, is_optimize_graph=True, is_quant_depthwise_conv=True, input_shape=None, is_dynamic_shape=False)

参数说明

参数名	输入/返回值	含义	使用限制
quant_mode	输入	量化模式。	可选。数据类型：int。可选值[0, 1]，默认值为1。 1表示Label-Free量化。 0表示Data-Free量化。
is_signed_quant	输入	激活是否符号量化。	可选。数据类型：bool。默认值为True，False表示Uint8量化，True表示Int8量化。 CNN类模型建议配置True，Transformer类模型建议配置False。
is_per_channel	输入	权重是否per_channel量化。	可选。数据类型：bool。默认值为True。
calib_data	输入	矫正数据。	可选。数据类型：list，默认值为[]。对于单输入模型，配置[[input1]]，多输入模型，配置[[input1,input2,input3]]。配置为空时，将随机生成矫正数据。
calib_method	输入	激活矫正的方法。	可选。数据类型：int。可选值[0,1,2]，默认值为0。 0表示min-max矫正。 1表示Percentile。 2表示Entropy。
quantize_nodes	输入	需要量化的节点。	可选。数据类型：list。默认值为[]。仅当列表为非空时，该字段生效。
exclude_nodes	输入	排除量化的节点名称。	可选。数据类型：list。默认值为[]。
amp_num	输入	混合精度回退层数。	可选。数据类型：int。默认为0。精度降低过多时，可以增大此值，以减少量化的层数。
is_optimize_graph	输入	是否进行图优化。	数据类型：bool，默认为True。
is_quant_depthwise_conv	输入	是否量化DepthWiseConv算子。	可选。数据类型：bool。默认为True。当模型中有DepthWiseConv算子，量化精度损失较大时，可以配置为False。
input_shape	输入	当输入模型支持动态shape时，用户需指定input_shape参数，用以生成量化时的校对数据。	可选，当模型支持动态shape时必须指定。数据类型：list [list] 默认值：[] 当模型有多个输入时，按照顺序指定input_shape，例如：[[1, 3,224, 224], [1, 3, 640, 640]]。
is_dynamic_shape	输入	指定输入的模型是否支持动态shape。	可选。输入模型支持动态shape时，另一配置参数input_shape也必须指定。数据类型：bool。默认为False。 True：输入的模型支持动态shape。 False：输入的模型为静态shape。

调用示例

from modelslim.onnx.post_training_quant import QuantConfig
def custom_read_data():
    calib_data = []
    # TODO 读取数据集，进行数据预处理，将数据存入calib_data
    return calib_data
calib_data = custom_read_data() 
quant_config = QuantConfig(calib_data=calib_data, amp_num=5)

父主题： post_training_quant接口