工具部署架构
基于AscendCL接口的
昇腾模型压缩工具
,其部署架构如
图1
所示。
图1
部署架构
用户需要先在带NPU设备的训练环境上安装CANN软件包,然后在该环境上安装
昇腾模型压缩工具
,并进行模型压缩,生成压缩后的*.air模型。
昇腾模型压缩工具
进行量化时(本手册主要是训练后量化),需要借助带NPU的设备进行校准推理。
用户将压缩后的*.air模型,借助CANN软件包提供的ATC工具,将*.air模型转换成
适配昇腾AI处理器的离线模型
。
使用
2
中的离线模型在
昇腾AI处理器
完成推理业务。
父主题:
概述