save_model

产品支持情况

产品

是否支持

Atlas A2 训练系列产品/Atlas 800I A2 推理产品/A200I A2 Box 异构组件

Atlas 200I/500 A2 推理产品

Atlas 推理系列产品

Atlas 训练系列产品

功能说明

训练后量化接口,根据量化因子记录文件record_file以及修改后的模型,插入AscendQuant、AscendDequant等算子,然后保存为可以在Onnx Runtime环境进行精度仿真的fake_quant模型,和可以在昇腾AI处理器做推理的部署模型。

函数原型

1
save_model(modfied_onnx_file, record_file, save_path)

参数说明

参数名

输入/输出

说明

modfied_onnx_file

输入

含义:文件名,存储融合后模型的onnx格式。

数据类型:string

record_file

输入

含义:量化因子记录文件路径及名称。

数据类型:string

save_path

输入

含义:模型存放路径。该路径需要包含模型名前缀,例如./quantized_model/*model

数据类型:string

返回值说明

约束说明

调用示例

1
2
3
4
5
6
7
8
9
import amct_pytorch as amct
# 进行网络推理,期间完成量化
for i in batch_num:
    output = calibration_model(input_batch)

# 插入API,将量化的模型存为ONNX文件
amct.save_model(modfied_onnx_file="./tmp/modfied_model.onnx",
                record_file="./tmp/scale_offset_record.txt",
                save_path="./results/model")

落盘文件说明:

重新执行量化时,该接口输出的上述文件将会被覆盖。