昇腾社区首页
中文
注册

HCCL_RDMA_TIMEOUT

功能描述

用于配置RDMA网卡重传超时时间的系数timeout。

RDMA网卡重传超时时间最小值的计算公式为:4.096μs * 2^timeout,其中timeout为该环境变量配置值,且实际重传超时时间与用户网络状况有关。

  • 针对Atlas 训练系列产品,该环境变量配置为整数,取值范围为[5,24],默认值为20。
  • 针对Atlas 300I Duo 推理卡,该环境变量配置为整数,取值范围是[5,24],默认值为20。
  • 针对Atlas A2 训练系列产品,该环境变量配置为整数,取值范围为[5,20],默认值为20。
  • 针对Atlas A3 训练系列产品/Atlas A3 推理系列产品,该环境变量配置为整数,取值范围为[5,20],默认值为20。

配置示例

# RDMA网卡重传超时时间的系数配置为6,则网卡启用RDMA功能时,重传超时时间最小值为:4.096μs * 2^6
export HCCL_RDMA_TIMEOUT=6

使用约束

支持的型号

Atlas 训练系列产品

Atlas 300I Duo 推理卡

Atlas A2 训练系列产品

Atlas A3 训练系列产品/Atlas A3 推理系列产品