create_compressed_retrain_model

产品支持情况

产品

是否支持

Atlas A2 训练系列产品/Atlas 800I A2 推理产品/A200I A2 Box 异构组件

  • 量化感知训练:
    • INT8量化:√
    • INT4量化:x
  • 通道稀疏:√
  • 4选2结构化稀疏:√

Atlas 200I/500 A2 推理产品

  • 量化感知训练:
    • INT8量化:√
    • INT4量化:x
  • 通道稀疏:√
  • 4选2结构化稀疏:√

Atlas 推理系列产品

  • 量化感知训练:
    • INT8量化:√
    • INT4量化:√
  • 通道稀疏:√
  • 4选2结构化稀疏:x

Atlas 训练系列产品

  • 量化感知训练:
    • INT8量化:√
    • INT4量化:x
  • 通道稀疏:√
  • 4选2结构化稀疏:x

注:特性中标记“x”的产品,调用接口不会报错,但是获取不到性能收益。

功能说明

静态组合压缩接口,根据用户设置的压缩配置文件对图结构先进行稀疏(通道稀疏或者4选2结构化稀疏,二选一),后插入量化相关的算子,并返回修改后的图。

函数原型

1
quant_add_ops = create_compressed_retrain_model(graph, config_defination, outputs, record_file)

参数说明

参数名

输入/输出

说明

graph

输入

含义:待稀疏的tf.Graph图。

数据类型:tf.Graph

config_defination

输入

含义:静态组合压缩简易配置文件路径。

用户提供的组合压缩配置文件,用于指定模型tf.Graph图中各层压缩配置情况。

基于retrain_config_tf.proto文件生成的简易配置文件compressed.cfg,*.proto文件所在路径为:AMCT安装目录/amct_tensorflow/proto/。

*.proto文件参数解释以及生成的compressed.cfg简易配置文件样例请参见量化感知训练简易配置文件

数据类型:string

outputs

输入

含义:模型输出节点的名称。

数据类型:list,列表中元素类型为string

record_file

输入

含义:待记录稀疏和量化因子文件路径及名称。

数据类型:string

返回值说明

组合压缩插入的算子变量列表,类型为list,列表中元素类型为tf.Variable。

约束说明

组合压缩配置文件至少存在一个配置:稀疏配置或者量化配置。

调用示例

1
2
import amct_tensorflow as amct
amct.create_compressed_retrain_model(graph, './tmp/sample.cfg', [operation_name_1, operation_name_2], './tmp/record.txt')

落盘文件: