昇腾社区首页
中文
注册

WeightQuantBatchMatmulV2TransposeFusionPass

融合模式

对于WeightQuantBatchMatmulV2所连接的transpose结点,将其信息下沉到transpose_x 和transpose_weight属性中。

使用约束

Atlas A2训练系列产品/Atlas 800I A2推理产品场景下, 当且仅当 weight结点连接transpose结点时,才处理quant_scale和quant_offset 所连接的transpose结点。

支持的型号

Atlas A2训练系列产品/Atlas 800I A2推理产品