昇腾社区首页
中文
注册

配置批量待安装场景

安装NPU驱动固件、CANN软件包、AI框架和MindCluster组件(性能测试,故障诊断,集群调度)、MindIE镜像和配置HCCN参数前需要参考以下操作完成配置。当前支持以下2种配置方式。

本章节主要指导批量安装的场景,单机安装可跳过。

编辑inventory_file文件

  1. 登录MindCluster Ascend Deployer执行机。
  2. MindCluster Ascend Deployer执行机上配置待安装的其他设备的IP地址、用户名。

    进入ascend-deployer/ascend_deployer目录,编辑inventory_file文件,在[worker]下面需注释或删除“localhost ansible_connection='local' ansible_ssh_user='root'”内容。按照表1,完成相关参数的配置,填写完成后执行:wq保存退出。

    表1 参数说明

    参数

    是否可选

    说明

    IP

    必选

    服务器的IP地址。

    ansible_ssh_user

    必选

    ssh登录远程服务器的账号,需要为root账号。

    ansible_ssh_pass

    可选

    ssh登录远程服务器账号的密码。

    如果配置了SSH密钥认证方式且root用户可以登录,则无需配置。

    npu_num

    可选

    设置NPU卡的数量,可核对识别到的NPU数量与规划NPU数量是否相符。

    davinci

    仅在安装MindIE时选填

    表示映射到容器的davinci,可以挂载一个或者多个davinci。可以通过执行ll /dev/ | grep davinci查询设备上davinci的名称及个数。

    如果不填写,则默认挂载设备上所有的davinci。

    安装1.0.RC3版本的MindIE时,davinci只能挂载1/2/4/8这样的数量,不能挂载3/5/6/7这样的数量。

  3. 在[all:vars]配置字段下完成全局变量配置。
    表2

    参数

    是否可选

    说明

    WEIGHTS_PATH

    可选

    安装MindIE时必填

    服务器上模型权重所在的目录,节点上真实存在的文件路径。

示例如下:
[worker]
xx.xxx.xx.xx1 ansible_ssh_user="root" ansible_ssh_pass="xxxxxxx"       #请替换为实际待安装设备的IP
xx.xxx.xx.xx2 ansible_ssh_user="root" ansible_ssh_pass="xxxxxxx" davinci=0,1,2,3       #请替换为实际待安装设备的IP

[all:vars]
WEIGHTS_PATH="/home/weights"            #请替换为模型权重所在目录

IP address支持配置IPv4和IPv6两种类型的IP地址,用户使用PuTTY等SSH客户端连接执行机的IP地址和inventory_file文件中配置的IP地址类型需要保持统一,均为IPv4或IPv6。