训练后量化接口,根据修改后的图结构,插入AscendQuant、AscendDequant等算子,将模型保存为量化后的离线模型文件。
save_model(file_name, model, input_data, file_format)
参数名 |
输入/返回值 |
含义 |
使用限制 |
---|---|---|---|
file_name |
输入 |
模型存放路径和文件名。 |
数据类型:string。 |
model |
输入 |
通过quantize_model接口生成的量化后的模型。 |
数据类型:MindSpore的Cell对象。 |
input_data |
输入 |
用户网络输入数据。 |
数据类型:MindSpore的Tensor。需要与MindSpore模型的input保持一致。 |
file_format |
输入 |
离线模型的格式。 |
可选值:AIR和MINDIR。默认值为AIR。 |
无。
from ascend_model_compression.mindspore.quant.ptq_quant.save_model import save_model # 插入API,保存量化的模型 file_name = "./save_model" input_data = ms.Tensor(np.random.uniform(size=[1, 3, 224, 224]), dtype=mstype.float32) save_model(file_name, calibrate_model, input_data, file_format="MINDIR")