昇腾社区首页
中文
注册

HCCL_CONCURRENT_ENABLE

功能描述

该环境变量用于配置超节点模式组网中超节点内是否支持HCCS和RDMA通信链路并发。

  • “1”:代表超节点内通信链路支持HCCS和RDMA并发,即通信数据同时采用HCCS和RDMA链路进行通信,从而提升通信性能。
  • “0”:代表超节点内通信链路不支持HCCS和RDMA链路并发,此模式下,超节点内通信链路采用HCCL_INTER_HCCS_DISABLE指定的链路类型进行通信,默认采用HCCS通信链路通信。

默认值为“0”。

配置示例

export HCCL_CONCURRENT_ENABLE=1

使用约束

  • 该环境变量配置为“1”时,环境变量HCCL_INTER_HCCS_DISABLE需配置为FALSE。
  • 该环境变量仅用于单个超节点内的通信链路配置,若组网中存在多个超节点,不支持使用此环境变量。
  • 环境变量HCCL_OP_EXPANSION_MODE指定了通信算法的编排展开位置,优先级高于该环境变量,具体约束如下:
    • HCCL_OP_EXPANSION_MODE配置为“HOST”时,HCCL_CONCURRENT_ENABLE支持开启,即配置为“1”。
    • HCCL_OP_EXPANSION_MODE配置为“AI_CPU”或“AIV”时,超节点内通信链路不再支持HCCS和RDMA并发,HCCL_CONCURRENT_ENABLE默认关闭,即使配置为“1”,也会按照默认值“0”处理。

支持的型号

Atlas A3 训练系列产品/Atlas A3 推理系列产品