GetTrainingDataTraceSwitch

功能说明

外部调用获取各类数据动态打点开关状态。

函数原型

rpc GetTrainingDataTraceSwitch (DataStatusReq) returns (DataStatusRes)

输入参数说明

参数

类型(protobuf定义)

说明

DataStatusReq

message DataStatusReq{

string jobNsName = 1;

}

jobNsName:所需修改的任务的命名空间和任务名称,以’/’拼接,如:default/test-pytorch。

返回值说明

参数

类型(protobuf定义)

说明

DataTypeRes

message DataStatusRes{

string message = 1;

ProfilingSwitch profilingSwitch = 2;

int32 code =3;

}

message:接口调用结果信息

profilingSwitch:各类开关详情

CommunicationOperator:通信算子开关

Step:step时延开关

SaveCheckpoint:saveCheckpoint耗时开关

FP:前向传播数据开关

DataLoader: dataloader耗时开关

code:接口调用返回码。
  • 1:300,入参不合法。
  • 2:404,无法查询ConfigMap。
  • 3:500,服务端异常。
  • 4:200,接口正常返回。