RANK_SIZE
功能描述
TensorFlow分布式训练场景下,通过此环境变量指定当前训练进程对应的Device在本集群大小,即集群Device的数量。
配置示例
export RANK_SIZE=2
是否必选
TensorFlow分布式训练场景下,若通过ranktable配置文件方式指定资源信息,此环境变量“必选”。
使用约束
无
支持的型号
Atlas 训练系列产品
Atlas 300I Duo 推理卡
Atlas A2 训练系列产品
父主题: 资源信息配置