配置other_build_image
MindCluster Ascend Deployer工具在批量安装及升级DL组件(集群调度)时,支持在异构节点(与执行机架构不一致的worker节点)上批量安装与升级MindCluster 集群调度。请选取一个异构节点作为异构镜像的构建服务器,并在构建服务器上完成inventory_file文件中other_build_image(异构服务器信息)的配置即可。
异构场景说明
MindCluster Ascend Deployer工具仅支持在以下场景中支持异构。
执行机架构 |
master节点所在服务器架构 |
worker节点所在服务器架构 |
---|---|---|
X86 |
X86 |
ARM |
配置other_build_image
参数 |
是否可选 |
说明 |
---|---|---|
IP |
必选 |
请配置为异构节点所在服务器的IP地址。 |
ansible_ssh_user |
必选 |
异构节点ssh登录远程服务器的账号,需要为root账号。 |
ansible_ssh_pass |
可选 |
异构节点ssh登录远程服务器账号的密码。 如果配置了SSH密钥认证方式且root用户可以登录,则无需配置。 |
set_hostname |
可选,多master或多worker节点时必选,单节点时可选 |
设置异构节点在K8s集群中的节点名,建议用“master-1”或“worker-1”的格式,按照顺序填充;如果已有K8s集群,则该名字需要为异构节点在K8s中的名字,必须配置为小写,不可随意填写。 |
父主题: 常用操作