昇腾社区首页
中文
注册

GroupedMatmulTransFusionPass

融合模式

融合模式一:将Transpose或TransposeD从图中删除,并将weight转置信息打在算子属性上。如下图所示。

该融合模式支持的产品如下。

Atlas 200I/500 A2 推理产品

Atlas 推理系列产品

Atlas 训练系列产品

Atlas A2 训练系列产品/Atlas 800I A2 推理产品/A200I A2 Box 异构组件

Atlas A3 训练系列产品/Atlas A3 推理系列产品

融合模式二:将weight前的Reshape+Transpose/TransposeD+Reshape从图中删除,并将weight转置信息打在算子属性上。如下图所示。

该融合模式支持的产品如下。

Atlas A2 训练系列产品/Atlas 800I A2 推理产品/A200I A2 Box 异构组件

Atlas A3 训练系列产品/Atlas A3 推理系列产品

使用约束

  • 只支持输入x为单tensor、weight为单tensor、y为单tensor的场景(单tensor表示tensorList输入中只有一个tensor)。
  • Transpose/TransposeD支持第二轴和第三轴转置。