昇腾社区首页
中文
注册
开发者
下载

ReplyStressTestResult

功能说明

客户端向ClusterD返回在线压测结果的接口。

函数原型

rpc ReplyStressTestResult(StressTestResult) returns (Status) {}

输入参数说明

参数

类型(Protobuf定义)

说明

StressTestResult

message StressTestResult {

string jobId = 1;

map<string, StressTestRankResult> stressResult = 2;

}

message StressTestRankResult {

map<string, StressTestOpResult> rankResult= 1;

}

message StressTestOpResult {

string code = 1;

string result = 2;

}

StressTestResult.jobId:任务ID。

StressTestResult.stressResult:指令执行的结果。key为执行压测的global rankID;value为执行压测的结果。

StressTestRankResult.rankResult:某张卡执行压测的结果。key为压测的操作,0表示“aic”压测;1表示“p2p”压测。value为对应的结果。

StressTestOpResult.code:压测结果的错误码。

  • 0表示执行成功,无故障
  • 1表示压测失败,可正常恢复训练
  • 2表示发现压测故障,需要隔离对应节点
  • 3表示压测超时,该节点任务退出重启
  • 4表示压测电压未恢复,该节点任务退出重启

StressTestOpResult.result:压测结果的描述信息。

返回值说明

参数

类型(Protobuf定义)

说明

Status

message Status{

int32 code = 1;

string info =2;

}

Status.code:返回码。

  • 取值为0:表示流程正常
  • 其他值:表示流程异常

Status.info返回信息描述。