配置环境变量
Rec SDK Torch环境变量的说明如表1所示。
环境变量名 |
含义 |
可选/必选 |
说明 |
---|---|---|---|
INPUT_DIST_THREADS |
Rec SDK Torch使用分桶任务的线程池并发数量。 |
可选 |
整数,取值范围:[1, 12] |
POST_INPUT_THREADS |
Rec SDK Torch使用哈希去重任务的线程池并发数量。 |
可选 |
整数,取值范围:[1, 12] |
MASTER_ADDR |
用于指定分布式训练中主节点的IP地址。 |
可选 |
IPv4地址,推荐使用127.0.0.1 |
MASTER_PORT |
用于指定分布式训练中的侦听端口。 |
可选 |
整数,取值范围:[0,65520] |
LOCAL_RANK |
当前进程在本机上的NPU编号。 |
可选 |
整数,取值范围:[0,world_size -1] |
WORLD_SIZE |
参与训练的device数量。 |
可选 |
整数,取值范围:[1,8] |
ASCEND_VISIBLE_DEVICES |
昇腾处理器可见的设备,来指定程序只使用其中的部分设备。 |
必选 |
使用ASCEND_VISIBLE_DEVICES环境变量指定训练中的NPU设备(用户可执行ls /dev/ | grep davinci*命令查询宿主机的NPU设备),使用设备序号指定设备,支持单个和范围指定且支持混用。例如: |
ASCEND_OPP_PATH |
算子库根目录。 |
必选 |
执行CANN环境变量配置脚本时设置,不建议用户修改。 |
GLOO_SOCKET_IFNAME |
gloo通信网卡配置。 |
可选 |
使用ifconfig或ip a命令查看服务器网卡名称,推荐配置为lo |
父主题: 安装部署