在模型调测时遇到报错“RuntimeError: malloc:/..../pytorch/c10/npu/NPUCachingAllocator.cpp:293 NPU error, error code is 500000.”
报错信息
问题分析
对于NPUCachingAllocator中malloc类型的错误原因一般为NPU显存不足,所需显存大于NPU上可用显存。
处理方法
在模型调测中,可用通过减小batchsize参数来减少NPU显存的分配,解决该问题。
父主题: 模型调优相关问题