昇腾社区首页
中文
注册

基于节点的亲和性

基于节点的交换机亲和性,即一个交换机下有多个节点,系统会根据配置的交换机亲和性规则,选择最合适的节点分配给训练任务。

使用说明

  • 同一个交换机,不能同时被多个跨交换机的任务调用。
  • 交换机的网络架构为Spine+Leaf网络架构。

普通任务交换机亲和性

  • 普通任务副本数小于M时,优先选择剩余可用节点少的交换机下的节点,其次选择未被使用的交换机下的节点,最后选择跨交换机时不会产生Spine交换机下行流量拥塞的节点,最后随机调度。
  • 普通任务副本数大于M时,优先选择未被使用的交换机下的节点,其次选择跨交换机时不会产生Spine交换机下行流量拥塞的节点,最后随机调度。

M为一台Leaf交换机下的节点个数。

大模型任务交换机亲和性

  • 大模型任务副本数小于M时,优先选择剩余可用节点少的交换机下的节点,其次选择未被使用的交换机下的节点。
  • 大模型任务副本数大于M时,优先选择未被使用的交换机下的节点,其次选择跨交换机时不会产生Spine交换机下行流量拥塞的节点。

M为一台Leaf交换机下的节点个数。