基于节点的亲和性
基于节点的交换机亲和性,即一个交换机下有多个节点,系统会根据配置的交换机亲和性规则,选择最合适的节点分配给训练任务。
使用说明
- 同一个交换机,不能同时被多个跨交换机的任务调用。
- 交换机的网络架构为Spine+Leaf网络架构。
普通任务交换机亲和性
- 普通任务副本数小于M时,优先选择剩余可用节点少的交换机下的节点,其次选择未被使用的交换机下的节点,最后选择跨交换机时不会产生Spine交换机下行流量拥塞的节点,最后随机调度。
- 普通任务副本数大于M时,优先选择未被使用的交换机下的节点,其次选择跨交换机时不会产生Spine交换机下行流量拥塞的节点,最后随机调度。

M为一台Leaf交换机下的节点个数。
大模型任务交换机亲和性
- 大模型任务副本数小于M时,优先选择剩余可用节点少的交换机下的节点,其次选择未被使用的交换机下的节点。
- 大模型任务副本数大于M时,优先选择未被使用的交换机下的节点,其次选择跨交换机时不会产生Spine交换机下行流量拥塞的节点。

M为一台Leaf交换机下的节点个数。