开发者
下载

--is_weight_clip

产品支持情况

全量芯片支持。

功能说明

浮点类型权重数据高位转低位时,是否对数据进行裁剪。

当原始模型权重为高位数据类型(如 Float32),在转换过程中插入 Cast 算子将其转为低位数据类型(如 Float16)时,可能因数值范围限制导致数据溢出。通过配置--is_weight_clip参数,可在 Cast 算子前对高位数据进行裁剪处理,从而有效防止溢出,确保数据完整性。

关联参数

无。

参数取值

  • 0:不裁剪。
  • 1:(默认值)裁剪。

推荐配置及收益

无。

示例

--is_weight_clip=1

依赖约束

无。