昇腾故障案例详情页

Atlas 800-3010 Ubuntu系统配置kdump触发crash卡死

更新时间: 2021/09/02

暂无评分

问题信息

问题来源产品大类产品子类关键字
实验室安装部署驱动固件Ubuntu、kdump、卡死

问题现象描述

Ubuntu系统配置kdump后,系统crash会卡死,无法正常生成内存转储。

关键过程、根本原因分析

  1. apt-get install linux-crashdump成功安装kdump,kdump-config show检查kdump成功配置并启动。
  2. 查看crashkernel默认配置大小为128M,当前服务器内存配置大小为64G。

  3. 修改crashkernel大小为512M后,crash后可以正常收集转储日志。

    ls /var/crash

    201809240744 kexec_cmd linux-image-4.15.0-34-generic-201809240744.crash

  4. Ubuntu官方参考链接:https://help.ubuntu.com/lts/serverguide/kernel-crash-dump.html,大多数情况下需要配置512M预留内存大小。

结论、解决方案及效果

结论:crashkernel默认配置太小。

解决方案:
  1. 配置更大预留内存,/etc/default/grub.d/kdump-tools.cfg中添加。

    GRUB_CMDLINE_LINUX_DEFAULT="$GRUB_CMDLINE_LINUX_DEFAULT crashkernel=384M-:512M"

  2. sudo update-grub
  3. reboot

经验总结、预防措施和规范建议

备注

本页内容

该页面对您有帮助吗?
我要评分