功能描述
用于配置Server内是否使用PCIe环路进行多卡间的通信。
该环境变量可以单独配置,也可以与环境变量HCCL_INTRA_ROCE_ENABLE同时使用,配置说明如下:
- HCCL_INTRA_PCIE_ENABLE为1,HCCL_INTRA_ROCE_ENABLE不配置,Server内采用PCIe环路进行多卡间的通信。
- HCCL_INTRA_PCIE_ENABLE不配置,HCCL_INTRA_ROCE_ENABLE为1,Server内采用RoCE环路进行多卡间的通信。
- HCCL_INTRA_PCIE_ENABLE为1,HCCL_INTRA_ROCE_ENABLE为0,Server内采用PCIe环路进行多卡间的通信。
- HCCL_INTRA_PCIE_ENABLE为0,HCCL_INTRA_ROCE_ENABLE为1,Server内采用RoCE环路进行多卡间的通信。
- HCCL_INTRA_PCIE_ENABLE为0,HCCL_INTRA_ROCE_ENABLE为0,Server内采用PCIe环路进行多卡间的通信。
- 若HCCL_INTRA_PCIE_ENABLE和HCCL_INTRA_ROCE_ENABLE均未配置,默认Server内采用PCIe环路进行多卡间的通信。
- 不支持HCCL_INTRA_PCIE_ENABLE和HCCL_INTRA_ROCE_ENABLE同时配置为1。
配置示例
export HCCL_INTRA_PCIE_ENABLE=1
使用约束
Atlas 200T A2 Box16 异构子框存在左右两个模组,分别为0~7卡和8~15卡,针对此产品:
单机场景下,当Server内采用PCIe环路时,若需要同时使用两个模组的卡,两个模组需使用相同的卡数且在同一平面,即0卡和8卡、1卡和9卡(以此类推)需要同时使用;当Server内采用RoCE环路时,无此限制。