HCCL_CONCURRENT_ENABLE
功能描述
该环境变量用于配置超节点模式组网中超节点内是否支持HCCS和RDMA通信链路并发。
- “1”:代表超节点内通信链路支持HCCS和RDMA并发,即通信数据同时采用HCCS和RDMA链路进行通信,从而提升通信性能。
- “0”:代表超节点内通信链路不支持HCCS和RDMA链路并发,此模式下,超节点内通信链路采用HCCL_INTER_HCCS_DISABLE指定的链路类型进行通信,默认采用HCCS通信链路通信。
默认值为“0”。
配置示例
export HCCL_CONCURRENT_ENABLE=1
使用约束
- 该环境变量配置为“1”时,环境变量HCCL_INTER_HCCS_DISABLE需配置为FALSE。
- 该环境变量仅用于单个超节点内的通信链路配置,若组网中存在多个超节点,不支持使用此环境变量。
- 环境变量HCCL_OP_EXPANSION_MODE指定了通信算法的编排展开位置,优先级高于该环境变量,具体约束如下:
- HCCL_OP_EXPANSION_MODE配置为“HOST”时,HCCL_CONCURRENT_ENABLE支持开启,即配置为“1”。
- HCCL_OP_EXPANSION_MODE配置为“AI_CPU”或“AIV”时,超节点内通信链路不再支持HCCS和RDMA并发,HCCL_CONCURRENT_ENABLE默认关闭,即使配置为“1”,也会按照默认值“0”处理。
支持的型号
父主题: 集合通信