ENABLE_HF32_EXECUTION

功能描述

针对TensorFlow 1.15网络,是否启用HF32自动代替FP32数据类型的功能,当前版本此环境变量仅针对Conv类算子与Matmul类算子生效。
  • "1":启用FP32数据类型自动转换为HF32数据类型的功能。
  • "0":关闭FP32数据类型自动转换为HF32数据类型的功能。
  • 若不配置此环境变量,针对Conv类算子,默认使能FP32转换为HF32,针对Matmul类算子,默认不使能FP32转换为HF32。
HF32是昇腾推出的专门用于算子内部计算的单精度浮点类型,与其他常用数据类型的比较如下图所示。可见,HF32与FP32支持相同的数值范围,但尾数位精度(11位)却接近FP16(10位)。通过降低精度让HF32单精度数据类型代替原有的FP32单精度数据类型,可大大降低数据所占空间大小,实现性能的提升。
图1 HF32与其他数据类型比较

配置示例

export ENABLE_HF32_EXECUTION=1

使用约束

支持的型号

Atlas A3 训练系列产品/Atlas A3 推理系列产品

Atlas A2 训练系列产品