简介
本节介绍基于torch module训练后量化的使用场景。
该特性仅在以下产品支持,使用时请确保PyTorch的版本2.1.0,详细配套请参见表1。
Atlas 350 加速卡
使用场景
基于torch module的训练后量化与基于图的量化的区别是:
基于模型图结构的优化压缩,要求PyTorch模型能够导出ONNX模型,基于图模型可以完成Conv+BN、Matmul+Add等图融合操作,压缩之后网络性能更好;而基于torch module的训练后量化没有上面的使用约束。
父主题: 基于torch module的量化