快速入门

昇腾模型压缩工具支持命令行方式和Python API接口方式量化原始网络模型,命令行方式相比Python API接口方式有以下优点:

表1 量化方式比较

命令行方式

Python API接口方式

量化准备动作简单,只需准备模型和模型匹配的数据集即可。

需要了解Python语法和量化流程。

量化过程简单,只涉及参数选择,无需对量化脚本进行适配。

需要适配修改量化脚本。

当前仅支持如下特性:

  • 训练后量化中的均匀量化。
  • 模型适配中的QAT模型适配Ascend模型。

支持量化的所有功能。

本章节以Sample中MobileNet V2网络模型为例,为您介绍如何借助命令行参数快速体验量化一个模型,Python API接口方式请参见量化。Sample获取链接请单击Link

  1. 获取待量化的TensorFlow网络模型。

    单击Link获取MobileNet V2网络模型,解压后将其中的(*.pb)文件,以昇腾模型压缩工具软件包运行用户上传至Linux服务器Sample目录cmd/model。

  2. 准备模型相匹配的二进制数据集。

    1. 单击Link获取MobileNet V2网络模型对应的数据集。
    2. 将上述获取的数据集解压后的calibration目录上传到Sample cmd/data/目录。
    3. 在cmd目录执行如下命令将jpg格式数据集转成bin格式。
      python3.7.5 ./data/process_data.py

      转换完成后,请删除calibration目录非bin格式的文件。

  3. 在任意目录执行如下命令进行网络模型的量化操作。如下命令中使用的目录以及文件均为样例,请以实际为准。

    amct_tensorflow calibration --model=./model/mobilenet_v2_1.0_224_frozen.pb --save_path=./results/mobilenet_v2 --outputs="MobilenetV2/Predictions/Reshape_1:0"  --input_shape="input:32,224,224,3" --data_dir="./data/calibration/" --data_types="float32"

    用户可以通过amct_tensorflow calibration --help命令查看命令行涉及的所有参数,关于参数的详细解释以及使用方法请参见命令行参数说明

  4. 若提示如下信息且无Error日志信息,则说明模型量化成功。

    INFO - [AMCT]:[save_model]: The model is saved in $HOME/xxx/results/mobilenet_v2.pb

    量化后生成文件说明如下:

    • amct_log/amct_tensorflow.log:记录了工具的日志信息,包括量化过程的日志信息。
    • results:
      • mobilenet_v2.pb:量化后的可在TensorFlow环境进行精度仿真并可在昇腾AI处理器部署的模型。
      • mobilenet_v2_quant.json:量化信息文件(该文件名称和量化后模型名称保持统一),记录了量化模型同原始模型节点的映射关系,用于量化后模型同原始模型精度比对使用。
    • (可选)随机数_时间戳:该目录只有set_logging_level接口打屏日志级别设置为debug才会生成。
      • quant_config.json:量化配置文件,描述了如何对模型中的每一层进行量化。如果当前目录已经存在量化配置文件,则再次进行量化时,如果新生成的量化配置文件与已有的文件同名,则会覆盖已有的量化配置文件,否则生成新的量化配置文件。

        实际量化过程中,如果量化后的模型推理精度不满足要求,则用户可以根据量化后的quant_config.json,自行构造简易配置文件config.cfg,构造原则请参见调优流程。然后使用--calibration_config参数重新进行量化。通过该文件用户可以自行决定校准使用的数据量,以及控制哪些层进行量化等。

      • record.txt:记录量化因子的文件。关于该文件的原型定义请参见量化因子记录文件说明