功能描述
用于配置RDMA网卡重传超时时间的系数timeout。
RDMA网卡重传超时时间最小值的计算公式为:4.096μs * 2^timeout,其中timeout为该环境变量配置值,且实际重传超时时间与用户网络状况有关。
- 针对Atlas 训练系列产品,该环境变量配置为整数,取值范围为[5,24],默认值为20。
- 针对Atlas 300I Duo 推理卡,该环境变量配置为整数,取值范围是[5,24],默认值为20。
- 针对Atlas A2 训练系列产品,该环境变量配置为整数,取值范围为[5,20],默认值为20。
- 针对Atlas A3 训练系列产品/Atlas A3 推理系列产品,该环境变量配置为整数,取值范围为[5,20],默认值为20。
配置示例
# RDMA网卡重传超时时间的系数配置为6,则网卡启用RDMA功能时,重传超时时间最小值为:4.096μs * 2^6
export HCCL_RDMA_TIMEOUT=6
支持的型号
Atlas 训练系列产品
Atlas 300I Duo 推理卡
Atlas A2 训练系列产品
Atlas A3 训练系列产品/Atlas A3 推理系列产品