整卡调度
功能特点
支持用户运行训练或者推理任务时,将训练或推理任务调度到节点的整张NPU卡上,独占整张卡执行训练或者推理任务。整卡调度特性借助Kubernetes(以下简称K8s)支持的基础调度功能,配合Volcano或者其他调度器,根据NPU设备物理拓扑,选择合适的NPU设备,最大化发挥NPU性能,实现训练或者推理任务的NPU卡的调度和其他资源的最佳分配。
使用集群调度组件提供的Volcano组件,可以实现交换机亲和性调度和昇腾AI处理器亲和性调度。Volcano是基于昇腾AI处理器的互联拓扑结构和处理逻辑,实现了昇腾AI处理器最佳利用的调度器组件,可以最大化发挥昇腾AI处理器计算性能。关于交换机亲和性调度和昇腾AI处理器亲和性调度的详细说明,可以参见亲和性调度。
所需组件
- 调度器(Volcano或其他调度器)
- Ascend Device Plugin
- Ascend Docker Runtime
- Ascend Operator
- ClusterD
- NodeD
使用说明
- 安装组件请参考安装部署章节进行操作。
- 特性使用指导请参考整卡调度或静态vNPU调度(训练)章节进行操作。
父主题: 基础调度