ConvWeightCompressFusionPass
融合模式
对于Cube类运算算子,将Filter通过插入压缩算子进行压缩,对应Cube算子支持Conv2D、FullyConnection、MatMulV2算子。
融合成
使用约束
首节点(Conv2D/FullyConnection/MatMulV2)需要满足如下条件。
- 输入dtype必须是int8或者uint8。
- 需要支持AiCore。
- 不支持groups大于1 。
- 需要支持权重压缩。
- filter这一路的输入需要包含在白名单中,白名单包括:GroupPadding、ConvBnFilterHost、ConvScaleFilterHost、Concatv2HostCpuOp、RequantHostCpuOp、QuantWeightRollBack、GatherV2、GatherV2D、SwapCo、ReverseV2D、ConcatV2、TransData、Cast、Reshape、TransposeD、ReFormat、SqueezeV2、UnsqueezeV2、Maximum、Add、Mul、Sub、AscendWeightQuant。
父主题: 图融合规则说明