工具部署架构
其部署架构图如
图1
所示。
图1
部署架构
用户需要先在带NPU设备的在线推理环境上搭建TensorFlow CPU环境,然后在该环境上安装
AMCT
,进行模型压缩,生成压缩后的*.pb模型。
AMCT
进行量化时(本手册主要是训练后量化),需要借助带NPU的设备进行校准推理。
压缩后的*.pb模型,可以在NPU环境进行在线推理,也可以基于TensorFlow CPU环境完成精度仿真。
父主题:
概述