昇腾故障案例详情页

在进行跨平台模型加载时遇到报错ModuleNotFoundError: No module name 'torch_npu'

更新时间: 2023/06/06

暂无评分

问题信息

问题来源产品大类关键字
官方模型训练--

问题现象描述

  • 报错文本
    ......
    ModuleNotFoundError: No module name 'torch_npu'
  • 报错截图

原因分析

在进行跨平台模型加载时,调用torch.load(),遇到报错“ModuleNotFoundError: No module name 'torch_npu'。这是由于在保存模型时,没有将模型转换为CPU模型或者保存了NPU optimizer的信息。

解决措施

在NPU环境中执行代码,加载模型权重文件中的参数。后续再把模型放到CPU上再进行存储,存储后的文件将不依赖torch_npu包进行解析加载。样例解决方法如下所示。

tmp = torch.load('xxx.pt',map_location='cpu')
torch.save(tmp, 'new_xxx.pt')

本页内容

该页面对您有帮助吗?
我要评分