SameInputConv2dPass
融合模式
非量化场景:该融合将符合约束条件的多路Conv2D+Relu算子融合成一路Conv2D+Relu+Spilt融合算子,如下图所示。
融合成
量化场景:
该融合将符合约束条件的多路Conv2D+AscendRequant算子融合成一路Conv2D+AscendRequant+Split融合算子,如下图所示。
融合成
该融合将符合约束条件的多路Conv2D+AscendDequant+AscendQuant算子融合成一路Conv2D+AscendDequant+AscendQuant+Split融合算子,如下图所示。
融合成
使用约束
- 仅支持静态输入shape(fmap, filter, bias)。
- 仅支持Conv2D groups为1。
- 每路第一个Conv2D(图示中conv2d_0与conv2d_2)的filter batch之和需为16的倍数,如果fmap的data type为int8,filter batch之和需为32的倍数。
- filter仅支持const、RequantHostCpuOp、ConvBnFilterHost、AscendWeightQuant节点。
- 非量化场景下,仅支持最后的节点为relu或conv2d。
- 量化场景下,仅支持以dequant/requant/conv2d节点结尾。
支持的型号
Atlas 200/300/500 推理产品
Atlas 推理系列产品
Atlas 200/500 A2推理产品
Atlas 训练系列产品
父主题: 图融合规则说明