产品 |
是否支持 |
---|---|
x |
|
x |
|
√ |
|
x |
注:标记“x”的产品,调用接口不会报错,但是获取不到性能收益。
近似校准接口,删除插入的dump算子,替换用户校准的tf.graph中目标算子(Softmax)为昇腾亲和的高性能实现(FastSoftmax),并保存为既可在TensorFlow环境中进行精度仿真又可以在昇腾AI处理器部署的pb模型。
1 | save_approximation_graph(graph, outputs, save_path, config_defination=None) |
参数名 |
输入/输出 |
说明 |
---|---|---|
graph |
输入 |
含义:用户传入的待近似模型的tf.Graph。 数据类型:tf.Graph |
outputs |
输入 |
含义:graph中输出算子名称的列表。 进行算子替换可能会导致尾层输出节点变化,则此outputs列表也随之更新。 数据类型:list,列表中元素类型为string |
save_path |
输入 |
含义:模型存放路径。 该路径若包含模型名前缀,则保存模型路径会增加后缀_approximation.pb,例如传入/quantized_model/*model则模型保存为 /quantized_model/*model_approximation.pb。若不包含模型名前缀,则模型保存为approximation.pb。 数据类型:string |
config_defination |
输入 |
含义:用户提供的近似校准配置文件路径,用于指定模型tf.Graph图中各层近似校准选项及导出校准数据的batch数。需要注意此配置需与create_approximation_calibrator中传入的配置一致。 数据类型:string |
无
1 2 3 4 5 6 | result_model_path = './results/user_model' model_outputs = ['user_model_outputs0', 'user_model_outputs1'] amct.save_approximation_graph(graph=ori_graph, outputs=model_outptus , save_path=result_model_path, config_defination=None) |
落盘文件:完成近似校准的pb模型。