压缩优化功能配置文件路径以及文件名,通过该参数使能配置文件中指定的压缩优化特性,从而提升网络性能。
若通过该参数配置了calibration量化特性,则不能再使用高精度特性,比如不能再通过--precision_mode参数配置force_fp32或must_keep_origin_dtype(原图fp32输入);不能再通过--precision_mode_v2参数配置origin;不能通过--op_precision_mode配置high_precision参数等。在高精度模式下设置量化参数,既拿不到量化的性能收益,也拿不到高精度模式的精度收益。
参数值:配置文件路径以及文件名。
参数值格式:路径和文件名:支持大小写字母(a-z,A-Z)、数字(0-9)、下划线(_)、短横线(-)、句点(.)、中文汉字。
参数值约束:
当前仅支持配置如下两种压缩方式,用户根据实际情况决定配置哪种压缩方式:
enable_first_layer_quantization:true calibration: { input_data_dir: ./data.bin,d2.bin input_shape: in:16,16;in1:16,16 config_file: simple_config.cfg infer_soc: xxxxxx infer_aicore_num: 10 infer_device_id: 0 infer_ip: x.x.x.x infer_port: 8000 log: info }
其中:
使能enable_first_layer_quantization特性时,只有网络结构中存在AIPP+CONV2D结构,并且在atc命令中将--enable_small_channel参数设置为1时,才有可能获得性能收益。由于量化后的模型存在一定程度上的精度损失,用户根据实际情况决定是否使能该特性。
为防止日志文件、record文件、graph文件持续落盘导致磁盘被写满,请及时清理这些文件。
如果用户配置了ASCEND_WORK_PATH环境变量,则上述日志、量化因子record文件和graph文件存储到该环境变量指定的路径下,例如ASCEND_WORK_PATH=/home/test,则存储路径为:/home/test/amct_acl/amct_log_{pid}_时间戳。其中,amct_acl模型转换过程中会自动创建,{pid}为进程号。
参数默认值:无。
无
假设压缩优化功能配置文件名称为compression_optimize.cfg,文件内容配置示例如下:
enable_first_layer_quantization:true calibration: { input_data_dir: ./data.bin,d2.bin input_shape: in:16,16;in1:16,16 config_file: simple_config.cfg infer_soc: xxxxxx infer_aicore_num: 10 infer_device_id: 0 infer_ip: x.x.x.x infer_port: 8000 log: info }
将该文件上传到ATC工具所在服务器,例如上传到$HOME/module,使用示例如下:
--compression_optimize_conf=$HOME/module/compression_optimize.cfg
Atlas 200/300/500 推理产品
Atlas 推理系列产品
Atlas 训练系列产品
Atlas 200I/500 A2推理产品
Atlas A2训练系列产品/Atlas 800I A2推理产品
Atlas 200I/500 A2推理产品 Ascend RC场景,还需要在运行环境上安装NCS软件,并配置密钥证书,请参见NCS安装和启动(运行环境)、配置密钥证书。