交换机亲和性调度1.0

使用说明

普通任务交换机亲和性

大模型任务交换机亲和性

填充任务交换机亲和性

填充任务优先选择满足任务副本数要求,且剩余可用节点少的交换机下的节点;其次选择未被使用的交换机下的节点。

故障重调度

当任务所在节点或昇腾AI处理器出现故障时,任务会发生故障重调度。重调度前使用正常节点的Pod将会再次调度到原节点继续训练,故障节点上的Pod重新选择节点。