昇腾社区首页
中文
注册

Volcano

应用场景

K8s基础调度仅能通过感知昇腾芯片的数量进行资源调度。为实现亲和性调度,最大化资源利用,需要感知昇腾芯片之间的网络连接方式,选择网络最优的资源。MindCluster提供了部署在管理节点的Volcano服务,针对不同的昇腾设备和组网方式提供网络亲和性调度。

组件功能

  • 根据集群调度底层组件上报的故障信息及节点信息计算集群的可用设备信息。(self-maintain-available-card默认开启。self-maintain-available-card关闭的情况下,从集群调度底层组件获取集群的可用设备信息。)
  • 从K8s的任务对象中获取用户期望的资源数量,结合集群的设备数量、设备类型和设备组网方式,选择最优资源分配给任务。
  • 任务资源故障时,重新调度任务。

组件上下游依赖

图1 组件上下游依赖
  1. 根据ClusterD上报的信息计算集群资源信息。(此为默认使用ClusterD的场景)
  2. 接收第三方下发的任务拉起配置,根据集群资源信息,选择最优节点资源。
  3. 向计算节点的Ascend Device Plugin传递具体的资源选中信息,完成设备挂载。