Atlas 800-3010 Debian 9.9在第二内核加nr_cpus=8后,kdump测试失败
2022/03/03
57
问题信息
问题来源 | 产品大类 | 产品子类 | 关键字 |
---|---|---|---|
实验室问题 | 安装部署 | 驱动固件 | kdump、nr_cpus |
问题现象描述
Atlas 800-3010 Debian9.9,在第二内核添加nr_cpus=8后,系统突然宕机,未生成vmcore
# nano /etc/default/kdump-tools
KDUMP_CMDLINE_APPEND="irqpoll nr_cpus=4 nousb systemd.unit=kdump-tools.service ata_piix.prefer_ms_hyperv=0 console=ttyS0,115200"
关键过程、根本原因分析
具体请参见结论、解决方案及效果。
结论、解决方案及效果
结论:fio 压力超过磁盘处理能力极限,导致 io 处理流程较长,最终发生 softlockup
解决方案:
针对 fio 压测场景(其他场景保持默认或按其他说明配置)可执行如下措施:
延长 softlockup 触发时间和关闭 softlockup panic 设置(即发生 softlockup 时,系统不重启)。
1. 临时修改(重启会恢复默认配置)
执行如下命令:
sysctl -w kernel.watchdog_print_period=60
sysctl -w kernel.watchdog_thresh=30
sysctl -w kernel.softlockup_panic=0
2. 永久修改
添加如下配置到 /etc/sysctl.conf 文件中,然后执行 sysctl -p。
kernel.watchdog_print_period=60
kernel.watchdog_thresh=30
kernel.softlockup_panic=0
3. 验证方法
执行如下命令,查看执行结果
sysctl -a | grep -E "watchdog_print_period|watchdog_thresh|softlockup_panic"
查看输出数值是否为设置数值。
经验总结、预防措施和规范建议
无
备注
无
本页内容