CLUSTER_CONFIG配置文件参数说明
参数  | 
类型  | 
是否必填  | 
描述  | 
|||
|---|---|---|---|---|---|---|
cluster  | 
-  | 
集群配置。  | 
||||
cluster_nodes  | 
-  | 
Array of Cluster_node  | 
是  | 
集群资源信息描述。  | 
||
node_id  | 
-  | 
Integer  | 
是  | 
集群内节点编号,一般0作为主节点。  | 
||
node_type  | 
-  | 
String  | 
是  | 
节点类型,如ATLAS800。  | 
||
ipaddr  | 
-  | 
String  | 
是  | 
节点控制面通信的IP,如训练服务器为HOST IP、SOC服务器为头节点IP。  | 
||
port  | 
-  | 
Integer  | 
是  | 
节点控制面通信的端口。  | 
||
is_local  | 
-  | 
BOOL  | 
否  | 
多个Node组成集群时,此文件此节点是否是本机。默认为false。  | 
||
item_list  | 
-  | 
Array of item_info  | 
是  | 
云资源管理编排的执行该JOB的加速卡。  | 
||
-  | 
item_id  | 
Integer  | 
是  | 
Node内加速卡id。  | 
||
item_def  | 
-  | 
Node内同种类型的加速卡的公共属性。  | 
||||
device_list  | 
-  | 
Array of device_info  | 
否  | 
整芯片内包含几个物理device。  | 
||
device_id  | 
-  | 
Integer  | 
是  | 
整芯片内物理device id。  | 
||
item_type  | 
-  | 
-  | 
String  | 
是  | 
节点内加速卡类型。  | 
|
node_def  | 
-  | 
集群内同种类型Node的公共属性。  | 
||||
item  | 
item_type  | 
-  | 
String  | 
是  | 
节点内加速卡类型。  | 
|
父主题: 附录