下载
中文
注册
加载模型时出现out of memory报错提示

加载模型时出现out of memory报错提示

2025/03/24

131

暂无评分
我要评分

问题信息

问题来源产品大类关键字
官方模型推理加载、模型、out of memory

问题现象描述

部署service服务,加载LLaMA-65B模型时出现out of memory报错提示,如下图所示。

放大

原因分析

权重太大,内存不足。

解决措施

将config.json文件中ModelConfig的npuMemSize调小,比如调成8。

本页内容