昇腾社区首页
中文
注册

BatchMatMulDequantElemwiseFusionPass

融合模式

量化场景,将batchmatmul/matmul + dequant + elemwise融合为batchmatmul算子,elemwise算子broadcast到matmul上。

使用约束

  • 仅支持将Elemwise算子broadcast到Matmul的shape上,broadcast轴仅支持batch轴上。
  • Elemwise 算子仅支持Add和Sub算子

支持的型号

Atlas 200/500 A2推理产品