昇腾社区首页
中文
注册

动态vNPU调度

功能特点

动态vNPU调度需要Ascend Device Plugin组件上报其所在节点的可用AI Core数目。虚拟化任务上报后,Volcano经过计算将该任务调度到满足其要求的节点。该节点的Ascend Device Plugin在收到请求后自动切分出vNPU设备并挂载该任务,从而完成整个动态虚拟化过程。该过程不需要用户提前切分vNPU,在任务使用完成后又能自动回收,支持用户算力需求不断变化的场景。

使用须知

使用动态vNPU调度前,用户需要提前了解昇腾AI处理器支持的芯片类型、切分规则和切分模板等,详细信息请参见虚拟化实例

所需组件

  • Volcano
  • Ascend Device Plugin
  • Ascend Docker Runtime
  • ClusterD
  • NodeD

使用说明

  1. 安装组件请参考安装部署章节进行操作。
  2. 特性使用指导请参考动态vNPU调度(推理)章节进行操作。