V100NotRequantFusionPass
融合模式
该融合规则针对Dequant、Quant的处理如下。
- 对于Dequant算子,先在输入中插入RequantHostCpuOp算子,再判断scale的取值,如果scale < 2^(-14) || scale > 65504,设置sqrt_mode属性为true。如下图所示。
- 对于Quant算子,不修改图形,只判断scale的取值,如果scale < 2^(-14) || scale > 65504,设置sqrt_mode属性为true。
使用约束
无
支持的型号
Atlas 200/300/500 推理产品
Atlas 训练系列产品
父主题: 图融合规则说明