交换机亲和性调度2.0

当前只支持PyTorch框架使用交换机亲和性调度2.0。

使用说明

普通任务交换机亲和性

大模型任务交换机亲和性

表1 节点亲和性策略

亲和性调度策略

详细内容

独占交换机调度策略

按照交换机下可用节点数量,从大到小依次占满空闲交换机下的节点,直到剩余N个Pod未进行调度或者无法占满单个交换机下的节点。

被占满的空闲交换机属性修改为独占交换机,未调度的N个Pod使用共享交换机,遵循共享交换机调度策略。

共享交换机调度策略

优先使用独占交换机策略,占满空闲交换机下的节点后还剩余N个Pod未被调度,将采取以下共享交换机调度策略。
  • 集群中任务可使用的共享交换机数量为1时
    • 选择共享交换机节点数量最接近N的交换机进行调度。
    • 如果没有共享交换机满足,选择空闲交换机最接近N的交换机进行调度,并将该交换机属性修改为共享交换机。
  • 集群中任务可使用的共享交换机数量为2时
    • 选择一个共享交换机下可用节点数量,或者两个共享交换机下可用节点数量之和最接近N的交换机进行调度。
    • 如果一个交换机和两个交换机组合的节点数量相同,优先选择两个交换机的组合。
    • 如果没有共享交换机满足,选择空闲且独占交换机最接近N的交换机进行调度,并将该交换机属性修改为共享交换机。

填充任务交换机亲和性

不允许跨交换机调度,只允许将Pod部署在单个交换机内。优先使用独占交换机下节点数最接近任务Pod数的交换机下的节点,其次选择共享交换机下的节点,最后选择空闲交换机下的节点。

故障重调度

当任务所在节点或昇腾AI处理器出现故障时,任务会发生故障重调度。重调度前使用正常节点的Pod将会再次调度到原节点继续训练,故障节点上的Pod重新选择节点。优先选择重调度前任务使用的独占交换机下的其他节点,其次选择重调度前任务使用的共享交换机下的其他节点,最后使用重调度前未使用的节点。