加载模型时出现out of memory报错提示
2025/03/24
164
问题信息
| 问题来源 | 产品大类 | 关键字 | 
|---|---|---|
| 官方 | 模型推理 | 加载、模型、out of memory | 
问题现象描述
部署service服务,加载LLaMA-65B模型时出现out of memory报错提示,如下图所示。

原因分析
权重太大,内存不足。
解决措施
将config.json文件中ModelConfig的npuMemSize调小,比如调成8。
加载模型时出现out of memory报错提示
2025/03/24
164
问题信息
| 问题来源 | 产品大类 | 关键字 | 
|---|---|---|
| 官方 | 模型推理 | 加载、模型、out of memory | 
部署service服务,加载LLaMA-65B模型时出现out of memory报错提示,如下图所示。

权重太大,内存不足。
将config.json文件中ModelConfig的npuMemSize调小,比如调成8。