昇腾社区首页
中文
注册

ConvWeightCompressFusionPass

融合模式

对于Cube类运算算子,将Filter通过插入压缩算子进行压缩,对应Cube算子支持Conv2D、FullyConnection、MatMulV2算子。

融合成

使用约束

首节点(Conv2D/FullyConnection/MatMulV2)需要满足如下条件。

  • 输入dtype必须是int8或者uint8。
  • 需要支持AiCore。
  • 不支持groups大于1 。
  • 需要支持权重压缩。
  • filter这一路的输入需要包含在白名单中,白名单包括:GroupPadding、ConvBnFilterHost、ConvScaleFilterHost、Concatv2HostCpuOp、RequantHostCpuOp、QuantWeightRollBack、GatherV2、GatherV2D、SwapCo、ReverseV2D、ConcatV2、TransData、Cast、Reshape、TransposeD、ReFormat、SqueezeV2、UnsqueezeV2、Maximum、Add、Mul、Sub、AscendWeightQuant。