昇腾社区首页
中文
注册

0xFC001003 MindIE Server Exception Alarm

事件解释

Controller检测到MindIE Server状态异常时,上报状态异常事件。

事件属性

事件ID

事件级别

事件类型

0xFC001003

重要

状态改变

事件参数

描述定位信息中的参数和附加信息中的参数。

类别

参数名称

参数含义

定位信息

servicename

组件名称“Controller”

mindie server ip

异常Server IP

附加信息

servicename

组件名称“Controller”

mindie server ip

异常Server IP

pod id

模型ID

对系统的影响

主Controller发生异常,备Controller接替主Controller承担业务逻辑,加载最新状态,恢复主Controller业务,确保业务连续性。

可能原因

  • MindIE Server无响应。
  • MindIE Server响应异常状态。
  • P实例或者D实例故障恢复重启,主动触发MindIE Server重启。

处理步骤

  1. 查看事件reasonID是否因为P实例或者D实例故障恢复重启,主动触发MindIE Server重启。
  2. 查看异常状态的MindIE Server所在服务器是否发生硬件故障。
  3. 根据异常状态MindIE Server的日志查看是否有软件故障。

事件清除

事件上报无需针对性清除。