返回顶部 量化 简介 量化是指对模型的权重(weight)和数据(activation)进行低比特处理,让最终生成的网络模型更加轻量化,从而达到节省网络模型存储空间、降低传输时延、提高计算效率,达到性能提升与优化的目标。本节介绍如何对Graph进行量化。 自动量化 手工量化 本节介绍如何手动修改模型插入量化算子,实现量化功能。 父主题: 专题