BatchMatMulDequantElemwiseFusionPass
融合模式
量化场景,将batchmatmul/matmul + dequant + elemwise融合为batchmatmul算子,elemwise算子broadcast到matmul上。
使用约束
- 仅支持将Elemwise算子broadcast到Matmul的shape上,broadcast轴仅支持batch轴上。
- Elemwise 算子仅支持Add和Sub算子
支持平台:Atlas 200I/500 A2推理产品
父主题: 图融合规则说明