配置批量待安装场景
安装NPU驱动固件、CANN软件包、AI框架和MindCluster组件(性能测试,故障诊断,集群调度)、MindIE镜像和配置HCCN参数前需要参考以下操作完成配置。当前支持以下2种配置方式。
本章节主要指导批量安装的场景,单机安装可跳过。
编辑inventory_file文件
- 登录MindCluster Ascend Deployer执行机。
- 在MindCluster Ascend Deployer执行机上配置待安装的其他设备的IP地址、用户名。
进入ascend-deployer/ascend_deployer目录,编辑inventory_file文件,在[worker]下面需注释或删除“localhost ansible_connection='local' ansible_ssh_user='root'”内容。按照表1,完成相关参数的配置,填写完成后执行:wq保存退出。
表1 参数说明 参数
是否可选
说明
IP
必选
服务器的IP地址。
ansible_ssh_user
必选
ssh登录远程服务器的账号,需要为root账号。
ansible_ssh_pass
可选
ssh登录远程服务器账号的密码。
如果配置了SSH密钥认证方式且root用户可以登录,则无需配置。
npu_num
可选
设置NPU卡的数量,可核对识别到的NPU数量与规划NPU数量是否相符。
davinci
仅在安装MindIE时选填。
表示映射到容器的davinci,可以挂载一个或者多个davinci。可以通过执行ll /dev/ | grep davinci查询设备上davinci的名称及个数。
如果不填写,则默认挂载设备上所有的davinci。
安装1.0.RC3版本的MindIE时,davinci只能挂载1/2/4/8这样的数量,不能挂载3/5/6/7这样的数量。
- 在[all:vars]配置字段下完成全局变量配置。
表2 参数
是否可选
说明
WEIGHTS_PATH
可选
安装MindIE时必填。
服务器上模型权重所在的目录,节点上真实存在的文件路径。
[worker] xx.xxx.xx.xx1 ansible_ssh_user="root" ansible_ssh_pass="xxxxxxx" #请替换为实际待安装设备的IP xx.xxx.xx.xx2 ansible_ssh_user="root" ansible_ssh_pass="xxxxxxx" davinci=0,1,2,3 #请替换为实际待安装设备的IP [all:vars] WEIGHTS_PATH="/home/weights" #请替换为模型权重所在目录

IP address支持配置IPv4和IPv6两种类型的IP地址,用户使用PuTTY等SSH客户端连接执行机的IP地址和inventory_file文件中配置的IP地址类型需要保持统一,均为IPv4或IPv6。