功能介绍
当进行分布式训练时,需要通过配置device的网卡IP,用于多个device间通信以实现网络模型参数的同步更新。
- 方式一:通过修改ascend-deployer工具提供的inventory_file,并执行脚本配置device的网卡IP。
- 方式二:使用昇腾软件中的HCCN Tool工具或使用ascend-deployer工具提供的配置脚本(ascend-deployer/ascend_deployer/tools/DeviceIP-conf.sh)配置device的网卡IP。
Atlas 300T 训练卡(型号 9000)、Atlas 800 训练服务器(型号 9000)(NPU半配)、Atlas 800 训练服务器(型号 9010)(NPU半配)不支持通过ascend-deployer工具配置参数面网络。
父主题: 配置参数面网络