昇腾社区首页
中文
注册

MatMulAlignInputsFusionPass

融合模式

当matmul算子输入shape内轴非512B对齐时,MTE效率较低,性能表现较差。该图融合就是将matmul的输入shape进行对齐,解决性能问题。

使用约束

仅适用于静态场景,且输入DType为Float32,输入不带bias。

非普通融合,仅对个别case做此融合

支持的型号

Atlas A2 训练系列产品/Atlas 800I A2 推理产品/A200I A2 Box 异构组件

Atlas A3 训练系列产品/Atlas A3 推理系列产品