昇腾社区首页
中文
注册

功能介绍

当进行分布式训练时,需要通过配置device的网卡IP,用于多个device间通信以实现网络模型参数的同步更新。

  • 方式一:通过修改ascend-deployer工具提供的inventory_file,并执行脚本配置device的网卡IP。
  • 方式二:使用昇腾软件中的HCCN Tool工具或使用ascend-deployer工具提供的配置脚本(ascend-deployer/ascend_deployer/tools/DeviceIP-conf.sh)配置device的网卡IP。

Atlas 300T 训练卡(型号 9000)Atlas 800 训练服务器(型号 9000)(NPU半配)Atlas 800 训练服务器(型号 9010)(NPU半配)不支持通过ascend-deployer工具配置参数面网络。