昇腾故障案例详情页

组件启动yaml执行成功,找不到组件对应的Pod

2023/06/13

152

暂无评分

问题信息

问题来源产品大类产品子类关键字
官方安装部署MindX DLPod、标签

问题现象描述

以Ascend Device Plugin为例,组件启动yaml执行成功,出现多个created。Ascend Device Plugin对应的K8s DaemonSet(ds)资源已经创建了,但是却找不到Pod。

原因分析

该节点可能缺少Ascend Device Plugin对应的标签,安装Ascend Device Plugin的节点必须要有“accelerator=huawei-Ascendxxx”标签,如:accelerator=huawei-Ascend910

解决措施

执行如下命令,为节点打上标签。
kubectl label nodes 主机名称 accelerator=huawei-Ascend910

更多节点对应的标签信息请参见《MindX DL 集群调度用户指南》中“安装集群调度组件 > 常用操作 >创建节点标签”章节。

本页内容

该页面对您有帮助吗?
我要评分