WeightQuantBatchMatmulV2TransposeFusionPass
融合模式
对于WeightQuantBatchMatmulV2所连接的transpose结点,将其信息下沉到transpose_x 和transpose_weight属性中。
使用约束
Atlas A2训练系列产品/Atlas 800I A2推理产品场景下, 当且仅当 weight结点连接transpose结点时,才处理quant_scale和quant_offset 所连接的transpose结点。
支持的型号
Atlas A2训练系列产品/Atlas 800I A2推理产品
父主题: 图融合规则说明