任务信息
job-summary-<任务名称>
参数 |
说明 |
取值 |
---|---|---|
hccl.json |
任务使用的芯片通信信息。 可转义为json格式,字段说明如下:
|
字符串 |
job_id |
任务的k8s ID信息。 |
字符串 |
operator |
|
字符串 |
deleteTime |
任务被删除的时间。 |
字符串 |
sharedTorIp |
任务使用的共享交换机信息。 |
字符串 |
MASTER_ADDR |
masterAddr pytorch训练时指定的MASTER_ADDR值。 |
字符串 |
total |
ConfigMap的个数。 |
整数类型 |
time |
任务开始时间。 |
字符串 |
framework |
任务使用的框架。 |
字符串 |
job_status |
任务状态,存在以下几种状态。
|
字符串 |
job_name |
任务名称 |
字符串 |
cm_index |
当前configmap的序号。 |
字符串 |
父主题: ClusterD