CLUSTER_CONFIG配置文件参数说明
| 参数 | 类型 | 是否必填 | 描述 | |||
|---|---|---|---|---|---|---|
| cluster | - | 集群配置。 | ||||
| cluster_nodes | - | Array of Cluster_node | 是 | 集群资源信息描述。 | ||
| node_id | - | Integer | 是 | 集群内节点编号,一般0作为主节点。 | ||
| node_type | - | String | 是 | 节点类型,如ATLAS800。 | ||
| ipaddr | - | String | 是 | 节点控制面通信的IP,如训练服务器为HOST IP、SOC服务器为头节点IP。 | ||
| port | - | Integer | 是 | 节点控制面通信的端口。 | ||
| is_local | - | BOOL | 否 | 多个Node组成集群时,此文件此节点是否是本机。 | ||
| item_list | - | Array of item_info | 是 | 云资源管理编排的执行该JOB的加速卡。 | ||
| - | item_id | Integer | 是 | Node内加速卡id。 | ||
| item_def | - | Node内同种类型的加速卡的公共属性。 | ||||
| device_list | - | Array of device_info | 否 | 整芯片内包含几个物理device。Atlas 训练系列产品不需要填写该配置项。 | ||
| device_id | - | Integer | 是 | 整芯片内物理device id。 | ||
| item_type | - | - | String | 是 | 节点内加速卡类型。 | |
| node_def | - | 集群内同种类型Node的公共属性。 | ||||
| item | item_type | - | String | 是 | 节点内加速卡类型。 | |
     父主题: 附录