昇腾社区首页
中文
注册

create_quant_retrain_model

产品支持情况

产品

是否支持

Atlas A2 训练系列产品/Atlas 800I A2 推理产品

  • INT8量化:√
  • INT4量化:x

Atlas 200I/500 A2 推理产品

  • INT8量化:√
  • INT4量化:x

Atlas 推理系列产品

  • INT8量化:√
  • INT4量化:√

Atlas 训练系列产品

  • INT8量化:√
  • INT4量化:x

注:上述INT4量化,标记“x”的产品,调用接口不会报错,但是获取不到性能收益。

功能说明

量化感知训练接口,根据用户设置的量化配置文件对图结构进行量化处理,该函数在config_file指定的层插入数据和weights伪量化层,将修改后的网络存为新的模型文件。

函数原型

1
retrain_ops = create_quant_retrain_model(graph, config_file, record_file)

参数说明

参数名

输入/输出

说明

graph

输入

含义:用户传入的待量化模型的tf.Graph图。

数据类型:tf.Graph

config_file

输入

含义:用户生成的量化感知训练配置文件,用于指定模型tf.Graph图中量化感知训练层的配置情况。

数据类型:string

record_file

输入

含义:量化因子记录文件路径。

数据类型:string

返回值说明

量化感知训练新增的层名变量列表,类型为list,列表中元素类型为tf.Variable。

调用示例

1
retrain_ops = amct.create_quant_retrain_model(graph, config_path, record_file)