昇腾故障案例详情页

任务容器未成功挂载NPU

更新时间: 2023/06/13

暂无评分

问题信息

问题来源产品大类产品子类关键字
官方安装部署MindX DL未挂载NPU

问题现象描述

在任务容器中,执行如下命令,系统无回显信息。此时表明容器内没有挂载上NPU设备。

ls /dev/davinci*

原因分析

Ascend Device Plugin的启动参数“useAscendDocker”默认为true,该参数表示Ascend Device Plugin需要配合Ascend Docker Runtime一起使用。若存在以下场景,可能导致Ascend Device Plugin配合Ascend Docker Runtime使用失败。

  • 环境未安装Ascend Docker Runtime。
  • 已安装Ascend Docker Runtime,但是未重启Docker服务。

解决措施

  • 原因一:

    请参考《MindX DL 集群调度用户指南》中“安装集群调度组件 > 常用操作 > 安装Ascend Docker Runtime”章节,安装Ascend Docker Runtime工具,然后重启Docker服务,删除旧任务,再重新下发任务。

  • 原因二:

    重启Docker服务,删除旧任务,再重新下发任务。

    Ascend Docker Runtime能够主动将指定的NPU挂载到容器内,可通过如下命令查询Docker的配置。

    docker info 2>&1 | grep "Default Runtime"

    回显信息中有“ascend”表示Docker使用了Ascend Docker Runtime,示例如下。

    Default Runtime: ascend

本页内容

该页面对您有帮助吗?
我要评分