IncreFlashAttentionQuantFusionPass

量化场景，将IncreFlashAttention+AscendQuant融合为IncreFlashAttention算子，quant的scale和offset转化为ifa的quant_scale2和quant_offset2入参。

Atlas A2 训练系列产品/Atlas A2 推理系列产品

Atlas A3 训练系列产品/Atlas A3 推理系列产品

Atlas 350 加速卡

父主题： 图融合规则说明