TensorFlow分布式训练场景下,通过此环境变量指定当前训练进程对应的Device在本集群大小,即集群Device的数量。
export RANK_SIZE=2
TensorFlow分布式训练场景下,若通过ranktable配置文件方式指定资源信息,此环境变量“必选”。
无
Atlas 训练系列产品
Atlas A2 训练系列产品