昇腾故障案例详情页

Atlas 800 CentOS 7.9 demsg日志中,打印"BERT:Boot Error Record Table support is disabled. Enable it by using bert_enable as kernel parameter"

更新时间: 2021/09/06

暂无评分

问题信息

问题来源产品大类产品子类关键字
版本测试安装部署驱动固件bert、BERT、打印消息

问题现象描述

CentOS7.9启动后,dmesg出现错误打印:“BERT: Boot Error Record Table support is disabled. Enable it by using bert_enable as kernel parameter.”。

关键过程、根本原因分析

AEPI的BERT表在早期启动时上报硬件错误,与HEST,ERST,EINJ一起上报硬件错误,例如更正的错误(CE)和未更正的错误(UC)。

通常情况下,发生硬件错误,内核会通过NMI、MCE或其他方法得到通知,有时内核会将错误处理情况,报告并恢复,但是当发生严重错误时,固件可能会不通知Linux内核直接重置。

当系统发生严重错误而重启时,此模块会有如下类似打印:

BERT: Error records from previous boot:

[Hardware Error]: It has been corrected by h/w and requires no further action

[Hardware Error]: event severity: corrected

[Hardware Error]: Error 0, type: recoverable

[Hardware Error]: section_type: memory error

[Hardware Error]: error_status: 0x0000000000000400

[Hardware Error]: physical_address: 0xffffffffffffffff

[Hardware Error]: card: 1 module: 2 bank: 3 row: 1 column: 2 bit_position: 5

[Hardware Error]: error_type: 2, single-bit ECC

从CentOS 7.9开始,X86和ARM平台均对此表支持。此功能默认关闭,若打开可添加内核参数命令行bert_enable。

结论、解决方案及效果

这条日志只是打印消息,不是告警,请忽略。

经验总结、预防措施和规范建议

备注

特性合入commit链接: https://patchwork.kernel.org/project/linux-acpi/patch/13e567e22ba4776893cf074117d32e3c3276acb5.1467225769.git.tony.luck@intel.com/

本页内容

该页面对您有帮助吗?
我要评分