昇腾社区首页
中文
注册

ConvWeightCompressFusionPass

融合模式

对于Cube类运算算子,将Filter通过插入压缩算子进行压缩,或通过插入四选二结构化稀疏算子进行稀疏。该Pass根据用户配置的参数执行压缩或者四选二结构化稀疏。

Cube类算子支持Conv2D、FullyConnection、MatMulV2。

融合成

使用约束

首节点(Conv2D/FullyConnection/MatMulV2)需要满足如下条件。

  • 索引为0的输入的dtype必须是int8或者uint8。
  • 需要支持AICore。
  • 不支持groups大于1 。
  • 需要支持权重压缩或四选二结构化稀疏

支持的型号

该Pass的有效性依赖于目标平台是否支持相应算子类型,具体信息请参考“CANN算子规格说明”章节。