简介

组合压缩是结合了通道稀疏量化感知训练的特性,根据配置文件先进行通道稀疏,然后进行量化:在通道稀疏时根据稀疏率和相应算法裁剪模型通道,直接更新模型权重;然后量化时,对稀疏后的模型插入数据和权重的量化层和SearchN的层,生成组合压缩模型,以期望得到更高的性能收益。生成组合压缩模型后,对模型进行重训练,保存量化部署模型和精度仿真模型。

当前组合压缩特性的压缩配置由用户手动处理(故又称之为静态组合压缩,压缩配置文件配置方法请参见量化感知训练简易配置文件说明),通过手动设置全局量化位宽和稀疏率(通道稀疏比例)实现模型自动压缩;如果组合压缩后,模型精度不满足要求,则需要参见通道稀疏下的手动调优章节和量化感知训练下的手动调优章节分别进行调优。组合压缩示例请参见获取更多样例>resnet101。

支持组合压缩的层以及约束请参见通道稀疏下的表1量化感知训练下的表1