restore_quant_retrain_model
产品支持情况
产品 |
是否支持 |
---|---|
|
|
|
|
|
|
|
注:上述INT4量化,标记“x”的产品,调用接口不会报错,但是获取不到性能收益。
功能说明
量化感知训练接口,将输入的待量化的图结构按照给定的量化感知训练配置文件进行量化处理,在传入的图结构中插入量化感知训练相关的算子(数据和权重的量化感知训练层以及找N的层),生成量化因子记录文件record_file,加载训练过程中保存的checkpoint权重参数,返回修改后的torch.nn.module量化感知训练模型。
函数原型
1 | quant_retrain_model = restore_quant_retrain_model (config_file, model, record_file, input_data, pth_file, state_dict_name=None) |
参数说明
参数名 |
输入/输出 |
说明 |
---|---|---|
config_file |
输入 |
含义:用户生成的量化感知训练配置文件,用于指定模型network中量化层的配置情况。 数据类型:string 使用约束:该接口输入的config.json必须和create_quant_retrain_model接口输入的config.json一致。 |
model |
输入 |
含义:待进行量化感知训练的原始模型,未加载权重。 数据类型:torch.nn.module |
record_file |
输入 |
含义:量化因子记录文件路径及名称。 数据类型:string |
input_data |
输入 |
含义:模型的输入数据。一个torch.tensor会被等价为tuple(torch.tensor)。 数据类型:tuple |
pth_file |
输入 |
含义:训练过程中保存的权重文件。 数据类型:string |
state_dict_name |
输入 |
含义:权重文件中的权重对应的键值。 默认值:None 数据类型:string |
返回值说明
返回修改后的torch.nn.module量化感知训练模型。
调用示例
1 2 3 4 5 6 7 8 9 10 11 12 13 | import amct_pytorch as amct # 建立待量化的网络图结构 model = build_model() input_data = tuple([torch.randn(input_shape)]) scale_offset_record_file = os.path.join(TMP, 'scale_offset_record.txt') # 插入量化API quant_retrain_model = amct.restore_quant_retrain_model( config_json_file, model, scale_offset_record_file, input_data, pth_file) |
父主题: 量化感知训练接口