gRPC接口

功能说明

接收处理gRPC客户端的公共故障发送请求,接入断点续训流程。

  • 实际的gRPC请求参数如果与定义的取值范围不相符,ClusterD会将故障信息丢弃,不作处理。
  • 通过ConfigMap或者gRPC接口注入的公共故障,所有节点的故障数量之和上限为5w。当故障数量超过5w时,再次注入故障,ClusterD会将故障信息丢弃,不作处理。
  • 公共故障消除需要将相应故障的recover事件通过gRPC接口发送给ClusterD

函数原型

rpc SendPublicFault(PublicFaultRequest) returns (RespStatus){}

输入参数说明

参数

类型(protobuf定义)

说明

PublicFaultRequest

message PublicFaultRequest {

string id=1;

int64 timestamp = 2;

string version = 3;

string resource = 4;

repeated Fault faults = 5;

}

message Fault {

string faultId=1;

string faultType = 2;

string faultCode = 3;

int64 faultTime = 4;

string assertion = 5;

map<string, string> faultLocation = 6;

repeated PubFaultInfo influence = 7;

string description = 8;

}

message PubFaultInfo {

string nodeName=1;

string nodeSN=2;

repeated int32 deviceIds = 3;

}

PublicFaultRequest.id:消息唯一标识

PublicFaultRequest.timestamp: 消息发送的时间戳

PublicFaultRequest.version:消息版本号

PublicFaultRequest.resource:故障发送方

PublicFaultRequest.faults:故障内容

Fault.faultId:故障实例id

Fault.faultType:故障类型

Fault.faultCode:故障码

Fault.faultTime:故障产生时间

Fault.assertion:故障状态

Fault.faultLocation:故障定位信息

Fault.influence:故障影响的范围

Fault.description:故障描述

PubFaultInfo.nodeName:节点名称

PubFaultInfo.nodeSN:节点SN号

PubFaultInfo.deviceIds:芯片物理id

以上参数的详细说明及取值情况请参见ConfigMap

返回值说明

返回值

类型(protobuf定义)

说明

RespStatus

message RespStatus {

int32 code = 1;

string info = 2;

}

RespStatus.code:返回码。

  • 取值为0:表示故障发送成功。
  • 其他值:表示故障发送失败。409表示请求参数有误,410表示消息发送频率超限。

RespStatus.info:返回信息描述。