昇腾社区首页
中文
注册

TransdataTransposeTransdataBatchMatMulv2FusionPass

融合模式

将双BatchMatMulV2节点间的TransData、Transpose等冗余节点删除。

模式一:

模式二:

模式三:

使用约束

第一个TransData的输出数据类型要求是float16;

所有节点都只能单引用;

Transpose的perm列表只能是[0,2,1,3],且最后一维要能被16整除;

第一个TransData的输入要跟第二个TransData的输出的Shape最后3维要完全一样

支持的型号

Atlas 推理系列产品