功能描述
针对TensorFlow 1.15网络,是否启用HF32自动代替FP32数据类型的功能,当前版本此环境变量仅针对Conv类算子与Matmul类算子生效。
- "1":启用FP32数据类型自动转换为HF32数据类型的功能。
- "0":关闭FP32数据类型自动转换为HF32数据类型的功能。
- 若不配置此环境变量,针对Conv类算子,默认使能FP32转换为HF32,针对Matmul类算子,默认不使能FP32转换为HF32。
HF32是昇腾推出的专门用于算子内部计算的单精度浮点类型,与其他常用数据类型的比较如下图所示。可见,HF32与FP32支持相同的数值范围,但尾数位精度(11位)却接近FP16(10位)。通过降低精度让HF32单精度数据类型代替原有的FP32单精度数据类型,可大大降低数据所占空间大小,实现性能的提升。
图1 HF32与其他数据类型比较
配置示例
export ENABLE_HF32_EXECUTION=1
支持的型号
Atlas A3 训练系列产品/Atlas A3 推理系列产品
Atlas A2 训练系列产品