基于TF_Adapter的TensorFlow网络模型量化,量化后的模型支持在NPU以及CPU进行推理,其部署架构图如图 部署架构所示。本手册仅介绍量化后的模型在NPU推理的场景。
其部署架构图如图1所示。
AMCT进行量化时(本手册主要是训练后量化),需要借助带NPU的设备进行校准推理。