昇腾社区首页
中文
注册

单层交换机亲和性调度

使用说明

  • 仅支持分布式推理任务进行单层交换机亲和性调度。
  • 任务副本总数不超过单个交换机下最大节点数。
  • 任务只能部署在同一个交换机下。
  • 满足任务需求前提下,优先选用剩余节点更少的交换机下的节点。

故障重调度

当任务所在节点或昇腾AI处理器出现故障时,任务会发生故障重调度。重调度前正常运行的节点的Pod将会再次调度到原节点继续训练,故障节点上的Pod重新选择节点。