MatMulTransposeWeightFusionPass 融合模式二维矩阵的第一个轴为外轴,第二个轴为内轴,比如A = M x K中,内轴为K,转置之后A^T = k x M,内轴为M。 当matmul/batchmatmul算子输入shape内轴的存储单元不是512Byte的倍数时,MTE效率较低,性能表现较差。该图融合就是将matmul的输入shape内外轴置换,以达到内外轴对齐,解决性能问题。 支持的型号Atlas A2 训练系列产品/Atlas 800I A2 推理产品/A200I A2 Box 异构组件 父主题: 图融合规则说明