单算子模式下,使用Host网卡进行HCCL初始化或集合通信计算时(即通信域的创建方式为“基于root节点信息创建”时),可以通过该环境变量指定Host网卡起始端口号,配置后系统默认占用以该端口起始的16个端口进行集群信息收集。
该环境变量需要配置为整数,取值范围为[1024,65520],请确保分配的端口未被占用。
export HCCL_IF_BASE_PORT=50000
sysctl -w net.ipv4.ip_local_reserved_ports=60000-60015
sysctl -w net.ipv4.ip_local_reserved_ports=50000-50015
Atlas 300I Duo 推理卡