下载
EN
注册
在模型调测时遇到报错“RuntimeError: malloc:/..../pytorch/c10/npu/NPUCachingAllocator.cpp:293 NPU error, error code is 500000.”

在模型调测时遇到报错“RuntimeError: malloc:/..../pytorch/c10/npu/NPUCachingAllocator.cpp:293 NPU error, error code is 500000.”

2023/06/06

484

暂无评分
我要评分

问题信息

问题来源产品大类关键字
官方模型训练--

问题现象描述

  • 报错截图

  • 报错文本
    Error: test_conv2d_npu (__main__.TestConv2dNPU)
    Traceback (most recent call last):
    ……
    RuntimeError: malloc:/***/pytorch/c10/npu/NPUCachingAllocator.cpp:293 NPU error, error code is 500000

原因分析

NPUCachingAllocator中malloc类型的错误原因一般为NPU显存不足,所需显存大于NPU上可用显存。

解决措施

在模型调测中,可减小batch size参数来减少NPU显存的分配。

本页内容