如果计划执行集群训练,训练节点须进行hccn_tool网络配置。
注意事项
- 若未配置相关参数,无法完成ip配置。
- 执行配置时,需提前对所有节点配置免密登录。
- hccn_inventory_file中“mode”可以选择“AMP”或“SMP”。
- hccn_inventory_file中“ip”、“detectip”配置格式有两种:
- 输入单个IP,工具自行生成后续IP,例如ip=10.0.0.1,工具会内部自行生成八个ip,10.0.0.1、10.0.1.1、10.0.2.1、10.0.3.1、10.0.0.2、10.0.1.2、10.0.2.2、10.0.3.2(该方法仅限于八卡环境);
- 按照hccn配置官方文档要求,例如八卡环境上,ip =10.0.0.1,10.0.1.1,10.0.2.1,10.0.3.1,10.0.0.2,10.0.1.2,10.0.2.2,10.0.3.2(逗号必须为英文)。detectip类似输入。