创建节点标签

K8s集群中,如果将包含昇腾AI处理器的节点作为K8s的管理节点,此时该节点既是管理节点又是计算节点,除了需要管理节点对应的标签外,还需要根据节点的昇腾AI处理器类型,打上计算节点的相关标签。生产环境中,管理节点一般为通用服务器,不包含昇腾AI处理器。

按照表 节点对应的标签信息的标签信息,在管理节点为对应节点打标签,方便集群调度组件在各种不同形态的工作节点之间进行调度。为节点打标签的命令参考如下,其中“主机名称”为K8s集群中的节点名。

kubectl label nodes 主机名称 标签

如:

kubectl label nodes ubuntu masterselector=dls-master-node
回显示例如下,表示操作成功。
node/ubuntu labeled
表1 节点对应的标签信息

节点类型

产品类型

标签

说明

管理节点

-

masterselector=dls-master-node

根据节点架构选择host-arch=huawei-arm或host-arch=huawei-x86其中之一。

计算节点

Atlas 800 训练服务器(NPU满配)

  • node-role.kubernetes.io/worker=worker
  • workerselector=dls-worker-node
  • host-arch=huawei-arm或host-arch=huawei-x86
  • accelerator=huawei-Ascend910

Atlas 800 训练服务器(NPU半配)

  • node-role.kubernetes.io/worker=worker
  • workerselector=dls-worker-node
  • host-arch=huawei-arm或host-arch=huawei-x86
  • accelerator=huawei-Ascend910
  • accelerator-type=half

服务器(插Atlas 300T 训练卡

  • node-role.kubernetes.io/worker=worker
  • workerselector=dls-worker-node
  • host-arch=huawei-arm或host-arch=huawei-x86
  • accelerator=huawei-Ascend910
  • accelerator-type=card

Atlas 200/300/500 推理产品

  • node-role.kubernetes.io/worker=worker
  • workerselector=dls-worker-node
  • host-arch=huawei-arm或host-arch=huawei-x86
  • accelerator=huawei-Ascend310

Atlas 推理系列产品(除Atlas 200I SoC A1 核心板

  • node-role.kubernetes.io/worker=worker
  • workerselector=dls-worker-node
  • host-arch=huawei-arm或host-arch=huawei-x86
  • accelerator=huawei-Ascend310P

Atlas 200I SoC A1 核心板

  • node-role.kubernetes.io/worker=worker
  • workerselector=dls-worker-node
  • host-arch=huawei-arm或host-arch=huawei-x86
  • accelerator=huawei-Ascend310P
  • servertype=soc