针对Atlas 训练系列产品,仅支持饱和模式,该环境变量不生效。
针对Atlas A2 训练系列产品,默认值为“1”INF_NAN模式,支持配置为“0”饱和模式。
Atlas A2 训练系列产品,该环境变量默认为“1”INF_NAN模式。如模型中使用了Inf/NaN,配置为“0”饱和模式时,会有不可预期的精度问题。因此,请勿在模型中使用了Inf/NaN的情况下进行配置更改。
饱和模式:Inf置为max,NaN置为0。
torch.exp(torch.tensor([12], dtype=torch.float16).npu()) # tensor([65504.], device='npu:0', dtype=torch.float16)
INF_NAN模式:IEEE 754标准模式,与GPU行为一致。
torch.exp(torch.tensor([12], dtype=torch.float16).npu()) # tensor([inf], device='npu:0', dtype=torch.float16)
export INF_NAN_MODE_ENABLE=1
否
无
Atlas 训练系列产品
Atlas A2 训练系列产品