本节介绍自动混合精度搜索场景的接口调用流程和调用示例。
接口调用流程如图1所示,蓝色部分为用户实现,灰色部分为用户调用AMCT提供的API实现。
用户准备好PyTorch的原始模型、自动混合精度配置文件和推理评估器(Evaluator),调用auto_mixed_precision_search,根据压缩率、量化位宽、量化敏感度以及计算复杂度信息,执行自动混合精度搜索,得到混合精度配置文件与可用于量化感知训练的简易配置文件。
其中Evaluator模块需要用户自定义,用来执行模型的推理,获取量化因子,dump数据(每一层的输入数据)等信息。
本示例演示了使用AMCT进行自动混合精度搜索的流程,该过程需要用户实现一个模型推理和校准的评估器。
1 2 |
import amct_pytorch as amct from amct_pytorch.common.auto_calibration import AutoCalibrationEvaluatorBase |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 |
class ModelEvaluator(AutoCalibrationEvaluatorBase): # The evaluator for model def __init__(self, *args, **kwargs): # 做成员变量初始化 pass def calibration(self, model, batch_num): """ 对模型做量化校准前向推理 model:torch.nn.Module类型, 对模型model做前向推理 batch_num: int类型,前向推理的batch数目,与量化配置的batch_num一致 """ pass def evaluate(self, model, iterations): """ 对一张图做量化校准前向推理 model:torch.nn.Module类型, 对模型model做前向推理 iterations: int类型,前向推理的batch数目 """ pass |
1 2 3 4 5 6 |
evaluator = ModelEvaluator() 或者 evaluator = amct.ModelEvaluator( data_dir="./data/input_bin/", input_shape="input:32,3,224,224", data_types="float32") |
1 2 3 4 5 |
model = build_model() input_data = tuple([torch.randn(input_shape)]) amc_config = './amc.cfg' save_dir = './results/model_name' amct.auto_mixed_precision_search(model=model, input_data=input_data, config=amc_config, save_dir=save_dir, evaluator=evaluator, sensitivity='MseSimilarity') |