K8s集群中,如果将包含昇腾AI处理器的节点作为K8s的管理节点,此时该节点既是管理节点又是计算节点,需同时打上管理节点与计算节点的相关标签。
按照以下步骤,在管理节点上分别执行以下命令,为对应节点打标签,方便MindX DL在各种不同形态的工作节点之间进行调度。以下命令示例中的“主机名称”为节点在K8s集群中的节点名,一般与hostname的值一致。如果存在多台机器的hostname一致,加入K8s集群后节点名会被修改成其他值,可以通过如下命令查看节点对应的“主机名称”。
kubectl get nodes -o wide
节点类型 |
命令 |
说明 |
---|---|---|
计算节点 |
kubectl label nodes 主机名称 node-role.kubernetes.io/worker=worker |
表示本节点为K8s的计算节点。 |
kubectl label nodes 主机名称 workerselector=dls-worker-node |
表示本节点为MindX DL的计算节点。 |
|
管理节点 |
kubectl label nodes 主机名称 masterselector=dls-master-node |
表示本节点为MindX DL的管理节点。 |
节点架构 |
命令 |
说明 |
---|---|---|
ARM |
kubectl label nodes 主机名称 host-arch=huawei-arm |
表示本节点为ARM架构。 |
X86 |
kubectl label nodes 主机名称 host-arch=huawei-x86 |
表示本节点为X86架构。 |
节点昇腾处理器类型 |
命令 |
说明 |
---|---|---|
Atlas训练系列产品 |
kubectl label nodes 主机名称 accelerator=huawei-Ascend910 |
表示本节点使用的是Atlas训练系列产品。 |
kubectl label nodes 主机名称 accelerator-type=card |
如果节点使用的是Atlas 300T 训练卡,则需要增加此标签。 |
|
Atlas 200/300/500 推理产品 |
kubectl label nodes 主机名称 accelerator=huawei-Ascend310 |
表示本节点使用的是Atlas 200/300/500 推理产品。 |
Atlas 推理系列产品 |
kubectl label nodes 主机名称 accelerator=huawei-Ascend310P |
表示本节点使用的是Atlas 推理系列产品。 |
kubectl label nodes 主机名称 servertype=soc |
如果节点使用的是Atlas 200I Soc A1 核心板,则需要增加此标签。 |