昇腾故障案例详情页

在模型运行或者算子运行时遇到报错“Error in atexit._run_exitfuncs:”

更新时间: 2023/06/06

暂无评分

问题信息

问题来源产品大类关键字
官方模型训练--

问题现象描述

  • 报错截图

  • 报错文本
    Error in atexit._run_exitfuncs:
    Traceback (most recent call last):
      File "/root/archiconda3/envs/***/lib/python3.7/site-packages/torch/__init__.py", line 429, in _npu_shutdown
        torch._C._npu_shutdown()
    RuntimeError

原因分析

在torch初始化时,若未通过torch_npu.npu.device(id)指定NPU设备,则默认使用device 0设备。若直接使用其他NPU设备,如指定在device 1上创建tensor,那么在运行时会出现上述错误。

解决措施

在调用NPU设备之前,通过torch_npu.npu.set_device(device)指定需要使用的NPU设备即可。

本页内容

该页面对您有帮助吗?
我要评分