进行跨多个进程的分布式训练时,用户可以选择不使用ranktable文件,通过组合使用环境变量CM_CHIEF_IP、CM_CHIEF_PORT、CM_CHIEF_DEVICE、CM_WORKER_SIZE、CM_WORKER_IP的方式自动生成资源信息,完成集合通信组件初始化。
本环境变量“CM_WORKER_IP”,用于配置当前Device和Master进行信息交换时所用的网卡IP。
格式为字符串,要求为常规IPV4或IPV6格式。
export CM_WORKER_IP = 192.168.0.1
此环境变量不能与RANK_TABLE_FILE、RANK_ID、RANK_SIZE混合使用。