Compressor

功能说明

权重压缩参数配置类,通过Compressor类封装压缩算法。

函数原型

Compressor(config: CompressConfig, weight_path=None, weight=None, quant_model_description=None)

参数说明

参数名

输入/返回值

含义

使用限制

config

输入

已配置的CompressConfig类。

必选。

数据类型:CompressConfig。

weight_path

输入

需要压缩的模型权重文件路径。

必选,weight、quant_model_description与weight_path二选一。

数据类型:String。

说明:
  • save()中输出save_type参数为numpy格式时,使用该方式传入权重文件。
  • 导出压缩后权重文件需要使用export()

quant_model_description

输入

量化权重描述文件。

必选,weight、quant_model_description与weight_path二选一。

数据类型:dict。

说明:
  • save()中输出save_type参数为safe_tensor格式时,使用该方式传入权重文件。
  • 导出压缩后权重文件需要使用export_safetensors()

weight

输入

量化工具生成的稀疏量化权重。

必选,weight、quant_model_description与weight_path二选一。

数据类型:dict。

说明:
  • save()中输出save_type参数为safe_tensor格式时,使用该方式传入权重文件。
  • 导出压缩后权重文件需要使用export_safetensors()

调用示例