在模型调测时遇到报错“RuntimeError: malloc:/..../pytorch/c10/npu/NPUCachingAllocator.cpp:293 NPU error, error code is 500000.”
2023/06/06
484
问题信息
问题来源 | 产品大类 | 关键字 |
---|---|---|
官方 | 模型训练 | -- |
问题现象描述
- 报错截图
- 报错文本
Error: test_conv2d_npu (__main__.TestConv2dNPU) Traceback (most recent call last): …… RuntimeError: malloc:/***/pytorch/c10/npu/NPUCachingAllocator.cpp:293 NPU error, error code is 500000
原因分析
NPUCachingAllocator中malloc类型的错误原因一般为NPU显存不足,所需显存大于NPU上可用显存。
解决措施
在模型调测中,可减小batch size参数来减少NPU显存的分配。
本页内容