下载
EN
注册
Atlas 800-3010 Debian 9.9在第二内核加nr_cpus=8后,kdump测试失败

Atlas 800-3010 Debian 9.9在第二内核加nr_cpus=8后,kdump测试失败

2022/03/03

57

暂无评分
我要评分

问题信息

问题来源产品大类产品子类关键字
实验室问题安装部署驱动固件kdump、nr_cpus

问题现象描述

Atlas 800-3010 Debian9.9,在第二内核添加nr_cpus=8后,系统突然宕机,未生成vmcore

# nano /etc/default/kdump-tools

KDUMP_CMDLINE_APPEND="irqpoll nr_cpus=4 nousb systemd.unit=kdump-tools.service ata_piix.prefer_ms_hyperv=0 console=ttyS0,115200"

关键过程、根本原因分析

具体请参见结论、解决方案及效果。

结论、解决方案及效果

结论:fio 压力超过磁盘处理能力极限,导致 io 处理流程较长,最终发生 softlockup

解决方案:

针对 fio 压测场景(其他场景保持默认或按其他说明配置)可执行如下措施:

延长 softlockup 触发时间和关闭 softlockup panic 设置(即发生 softlockup 时,系统不重启)。

1. 临时修改(重启会恢复默认配置)

执行如下命令:

sysctl -w kernel.watchdog_print_period=60

sysctl -w kernel.watchdog_thresh=30

sysctl -w kernel.softlockup_panic=0

2. 永久修改

添加如下配置到 /etc/sysctl.conf 文件中,然后执行 sysctl -p。

kernel.watchdog_print_period=60

kernel.watchdog_thresh=30

kernel.softlockup_panic=0

3. 验证方法

执行如下命令,查看执行结果

sysctl -a | grep -E "watchdog_print_period|watchdog_thresh|softlockup_panic"

查看输出数值是否为设置数值。

经验总结、预防措施和规范建议

备注

本页内容