华为计算微信公众号
昇腾AI开发者公众号
华为计算微博
华为计算今日头条
加载模型时出现out of memory报错提示
2025/03/24
426
问题信息
部署service服务,加载LLaMA-65B模型时出现out of memory报错提示,如下图所示。
权重太大,内存不足。
将config.json文件中ModelConfig的npuMemSize调小,比如调成8。
本页内容