下载
EN
注册

BatchMatMulDequantElemwiseFusionPass

融合模式

量化场景,将BatchMatMul/MatMul +Dequant + Elemwise融合为BatchMatMul算子,Elemwise算子broadcast到MatMul上。

使用约束

  • 仅支持将Elemwise算子broadcast到MatMul的shape上,broadcast轴仅支持batch轴上。
  • Elemwise算子仅支持Add和Sub算子。

支持的型号

Atlas 200/500 A2推理产品