PyTorch在容器中运行未挂载device问题
2022/07/18
1.7k
问题信息
问题来源 | 产品大类 | 产品子类 | 关键字 |
---|---|---|---|
官方 | 安装部署 | PyTorch | -- |
问题现象描述
在容器中运行脚本出现NPU相关ERROR。
原因分析
由于启动容器实例时,未挂载device参数,导致无法正常启动实例。
解决措施
请用户参考以下命令,重启容器。
docker run -it --ipc=host \ --device=/dev/davinciX \ --device=/dev/davinci_manager \ --device=/dev/devmm_svm \ --device=/dev/hisi_hdc \ -v /usr/local/Ascend/driver \ -v /usr/local/dcmi \ -v /usr/local/bin/npu-smi \ ${镜像名称}:{tag} \ /bin/bash
参数说明:
- /dev/davinciX:NPU设备,X是芯片物理ID号,例如davinci0。
- /dev/davinci_manager:管理设备。
- /dev/devmm_svm:管理设备。
- /dev/hisi_hdc:管理设备。
- /usr/local/Ascend/driver:驱动目录。
- /usr/local/dcmi:DCMI目录。
- /usr/local/bin/npu-smi:npu-smi工具。
- ${镜像名称}:{tag}:镜像名称与版本号。