进行跨多个进程的分布式训练时,需要向Helper配置集群的主调度进程列表。配置方式为环境变量,环境变量名为HELPER_CLUSTER。
export HELPER_CLUSTER = { "chief": "10.174.28.82:34961", "worker": ["10.174.28.83:23581","10.174.28.84"] }