昇腾社区首页
中文
注册

WeightQuantBatchMatmulV2TransposeFusionPass

融合模式

对于WeightQuantBatchMatmulV2所连接的Transpose节点,将其信息下沉到transpose_x和transpose_weight属性中。

使用约束

  • 当weight节点连接Transpose节点时,才处理antiquant_scale和antiquant_offset所连接的Transpose节点。
  • 该融合规则不可关闭,关闭后会触发功能问题。

支持的型号

Atlas A2 训练系列产品/Atlas 800I A2 推理产品/A200I A2 Box 异构组件

Atlas A3 训练系列产品/Atlas A3 推理系列产品