QuantizeAddLayerNormPass
融合模式
场景1:将算子AddLayerNorm的输出y所连接的两个Quantize算子或两个AscendQuantV2算子融合掉,融合成新算子DuaQuantizeAddLayerNorm。
场景2: 将算子AddLayerNorm的输出y所连接的1个AscendQuant或AscendQuantV2算子结点融合掉,融合成新算子QuantizeAddLayerNorm:
使用约束
融合为DuaQuantizeAddLayerNorm算子的场景,需要上游AddLayerNorm算子的x1, x2 输入的数据类型为bfloat16。
支持的型号
父主题: 图融合规则说明