昇腾社区首页
中文
注册

0xFC001004 Coordinator Service Exception Alarm

告警解释

  • 告警上报

    当Coordinator检测到自身健康状态异常或无可用的P实例或者D实例时,上报此告警。

  • 告警恢复

    当Coordinator检测到自身健康状态恢复且存在可用P、D实例时,上报该告警消除。

告警属性

告警ID

告警级别

告警类型

0xFC001004

紧急

业务质量告警

告警参数

描述定位信息中的参数和附加信息中的参数。

类别

参数名称

参数含义

定位信息

servicename

组件名称“Coordinator”

service ip

组件“Coordinator”ip

附加信息

servicename

组件名称“Coordinator”

service ip

组件“Coordinator”ip

pod id

模型ID

对系统的影响

Coordinator服务状态异常时,系统无法正常推理请求。

可能原因

  • 无可用P或者D实例组。
  • Coordinator自身状态异常。

处理步骤

  1. 检查集群硬件状态。
  2. 查看Coordinator日志当中是否有软件故障发生。

告警清除

当健康状态恢复和存在可用P、D实例时,该告警自动清除。