CM_CHIEF_DEVICE

功能描述

进行跨多个进程的分布式训练时,用户可以选择不使用ranktable文件,通过组合使用环境变量CM_CHIEF_IPCM_CHIEF_PORTCM_CHIEF_DEVICECM_WORKER_SIZECM_WORKER_IP的方式自动生成资源信息,完成集合通信组件初始化。

本环境变量“CM_CHIEF_DEVICE”用于指定Master节点中统计Server端集群信息的Device逻辑ID。

支持配置为字符串、数字,取值范围“0~AI Server内的最大Device数量”。

配置示例

export CM_CHIEF_DEVICE = 0

使用约束

此环境变量不能与RANK_TABLE_FILERANK_IDRANK_SIZE混合使用。