名称 |
作用 |
取值 |
使用组件 |
---|---|---|---|
ring-controller.atlas |
标识atlas的Pod |
|
Ascend Device Plugin、Ascend Operator、Volcano |
fault-scheduling |
任务故障重调度开关 |
grace、force、off |
Volcano、Resilience Controller |
elastic-scheduling |
任务弹性调度开关 |
on |
Resilience Controller、Volcano |
fault-retry-times |
任务发生业务面故障可以重调度的次数 |
0-100 |
Volcano、Ascend Operator |
tor-affinity |
交换机亲和性策略 |
|
Volcano |
npu-310-strategy |
标记推理服务器(插Atlas 300I 推理卡)调度策略 |
|
Volcano |
pod-rescheduling |
是否启用pod级重调度。 |
|
Volcano |
process-recover-enable |
是否启用进程级别重调度。 |
|
Volcano |
subhealthyStrategy |
亚健康处理策略 |
|
Volcano |