昇腾故障案例详情页

docker启动ms的faster RCNN demo 训练报错Insufficient shared memory available

更新时间: 2024/02/22

暂无评分

问题信息

问题来源产品大类产品子类关键字
官方模型训练MindSporedocker启动ms

问题现象描述

docker启动ms的faster RCNN demo 训练报错Insufficient shared memory available

原因分析

batch_size设置过大;

set_prefetch_size()接口参数设置过大;

host 侧shared内存不足;

排查方法

1.将batch_size改小,看是否能跑通。

2.将set_prefetch_size()接口入参设置小一点。

3.进入docker,运行df –h查看shared内存是否够用。

解决措施

使用docker run命令创建容器时添加—ipc=host参数(表示容器间都共享宿主机的内存),或者添加—shm-size参数指定内存大小(如--shm-size 800g)。

本页内容

该页面对您有帮助吗?
我要评分