GroupedMatmulTransFusionPass

融合模式一：将Transpose或TransposeD从图中删除，并将weight转置信息添加在算子属性上。如下图所示。

该融合模式支持的产品如下。

Atlas 200I/500 A2 推理产品

Atlas 推理系列产品

Atlas 训练系列产品

Atlas A2 训练系列产品 / Atlas A2 推理系列产品

Atlas A3 训练系列产品 / Atlas A3 推理系列产品

Atlas 350 加速卡

融合模式二：将weight前的Reshape+Transpose/TransposeD+Reshape从图中删除，并将weight转置信息打在算子属性上。如下图所示。

该融合模式支持的产品如下。

Atlas A2 训练系列产品 / Atlas A2 推理系列产品

Atlas A3 训练系列产品 / Atlas A3 推理系列产品

Atlas 350 加速卡

融合模式三：Atlas 350 加速卡的伪量化场景下，将weight/antiquantScale前的Reshape+Transpose/TransposeD+Reshape从图中删除，并将weight转置信息打在算子属性上。如下图所示。

融合模式四：Atlas 350 加速卡的MX量化场景下，融合模式是：将Transpose或TransposeD从图中删除，并将x和weight的转置信息打在算子属性上。如下图所示：

Atlas 350 加速卡的MX量化场景下，scale跟随weight的转置信息，pertokenScale跟随x的转置信息。

父主题： 图融合规则说明