HCCL_RDMA_TIMEOUT
功能描述
用于配置RDMA网卡重传超时时间的系数timeout。
RDMA网卡重传超时时间最小值的计算公式为:4.096μs * 2^timeout,其中timeout为该环境变量配置值,且实际重传超时时间与用户网络状况有关。
- 针对
Atlas 训练系列产品 ,该环境变量配置为整数,取值范围为[5,24],默认值为20。 - 针对Atlas 300I Duo 推理卡,该环境变量配置为整数,取值范围是[5,24],默认值为20。
- 针对
Atlas A2 训练系列产品 ,该环境变量配置为整数,取值范围为[5,20],默认值为20。 - 针对
Atlas A3 训练系列产品/Atlas A3 推理系列产品 ,该环境变量配置为整数,取值范围为[5,20],默认值为20。
配置示例
# RDMA网卡重传超时时间的系数配置为6,则网卡启用RDMA功能时,重传超时时间最小值为:4.096μs * 2^6 export HCCL_RDMA_TIMEOUT=6
使用约束
无
支持的型号
Atlas 300I Duo 推理卡
父主题: 集合通信