创建节点标签

K8s集群中,如果将包含昇腾AI处理器的节点作为K8s的管理节点,此时该节点既是管理节点又是计算节点,需同时打上管理节点与计算节点的相关标签

按照以下步骤,在管理节点上分别执行以下命令,为对应节点打标签,方便MindX DL在各种不同形态的工作节点之间进行调度。以下命令示例中的“主机名称”为节点在K8s集群中的节点名,一般与hostname的值一致。如果存在多台机器的hostname一致,加入K8s集群后节点名会被修改成其他值,可以通过如下命令查看节点对应的“主机名称”。

kubectl get nodes -o wide
  1. 创建标签,用以识别管理节点和计算节点。

    表1 各节点创建标签命令

    节点类型

    命令

    说明

    计算节点

    kubectl label nodes 主机名称 node-role.kubernetes.io/worker=worker

    表示本节点为K8s的计算节点。

    kubectl label nodes 主机名称 workerselector=dls-worker-node

    表示本节点为MindX DL的计算节点。

    管理节点

    kubectl label nodes 主机名称 masterselector=dls-master-node

    表示本节点为MindX DL的管理节点。

  2. 创建标签,用以识别计算节点的架构。

    表2 各架构创建标签命令

    节点架构

    命令

    说明

    ARM

    kubectl label nodes 主机名称 host-arch=huawei-arm

    表示本节点为ARM架构。

    X86

    kubectl label nodes 主机名称 host-arch=huawei-x86

    表示本节点为X86架构。

  3. 创建标签,用以识别计算节点的昇腾处理器类型。

    表3 各类处理器创建标签命令

    节点昇腾处理器类型

    命令

    说明

    Atlas训练系列产品

    kubectl label nodes 主机名称 accelerator=huawei-Ascend910

    表示本节点使用的是Atlas训练系列产品

    kubectl label nodes 主机名称 accelerator-type=card

    如果节点使用的是Atlas 300T 训练卡,则需要增加此标签。

    Atlas 200/300/500 推理产品

    kubectl label nodes 主机名称 accelerator=huawei-Ascend310

    表示本节点使用的是Atlas 200/300/500 推理产品

    Atlas 推理系列产品

    kubectl label nodes 主机名称 accelerator=huawei-Ascend310P

    表示本节点使用的是Atlas 推理系列产品

    kubectl label nodes 主机名称 servertype=soc

    如果节点使用的是Atlas 200I Soc A1 核心板,则需要增加此标签。