内存条出现UCE告警
2024/02/21
244
问题信息
问题来源 | 产品大类 | 产品子类 | 关键字 |
---|---|---|---|
官方 | 安装部署 | 硬件(Atlas 800T A2 训练服务器) | UCE告警 |
问题描述
服务器内存条出现UCE(Uncorrectable Error)告警,如图1所示,具体请参见ALM-0x01000017 DIMM MCE错误(Memory,紧急告警)。
解决方案
- 如果现场有备件,可以直接更换内存条。更换备件时服务器应先下电,拔出电源线,重新拔插后再上电,更换内存条的方法可以参见更换内存。
- 若时间充裕可将对应内存条重新拔插,检查是否存在连接问题。相关内存条位号,如DIMM320在服务器黑色导风罩上和CPU主板上均有标记。
本页内容