ConvWeightCompressFusionPass
融合模式
对于Cube类运算算子,将Filter通过插入压缩算子进行压缩,或通过插入四选二结构化稀疏算子进行稀疏。该Pass根据用户配置的参数执行压缩或者四选二结构化稀疏。
Cube类算子支持Conv2D、FullyConnection、MatMulV2。
融合成
使用约束
首节点(Conv2D/FullyConnection/MatMulV2)需要满足如下条件。
- 索引为0的输入的dtype必须是int8或者uint8。
- 需要支持AICore。
- 不支持groups大于1 。
- 需要支持权重压缩或四选二结构化稀疏。
父主题: 图融合规则说明