应用场景及方案

应用场景

昇腾虚拟化实例功能适用于多用户多任务并行,且每个任务算力需求较小的场景。对算力需求较大的大模型任务,不支持使用昇腾虚拟化实例。

虚拟化场景

昇腾虚拟化实例功能在物理机或虚拟机使用时,支持以下虚拟化场景,如表1所示。本文主要介绍在昇腾设备划分vNPU支持的场景和方法,如果涉及虚拟机相关的配置,需要结合另一本文档《Atlas 系列硬件产品 24.1.0 虚拟机配置指南》的“安装虚拟机>配置NPU直通虚拟机>NPU直通虚拟机”章节一起使用。

划分vNPU有以下两种方式。

表1 使用场景

昇腾虚拟化实例功能支持场景

操作流程

支持昇腾硬件

支持的虚拟化方式

在物理机划分vNPU,挂载vNPU到虚拟机

在物理机划分vNPU和挂载vNPU到虚拟机的步骤请参见《Atlas 系列硬件产品 24.1.0 虚拟机配置指南》的“安装虚拟机>配置NPU直通虚拟机>vNPU直通虚拟机”章节

Atlas 推理系列产品

  • Atlas 300I Pro 推理卡
  • Atlas 300V 视频解析卡
  • Atlas 300V Pro 视频解析卡
  • Atlas 300I Duo 推理卡

静态虚拟化

  • Atlas 800 训练服务器(型号 9000)
  • Atlas 800 训练服务器(型号 9010)

在物理机划分vNPU,挂载vNPU到容器

  1. 在物理机划分vNPU的步骤请参见创建vNPU
  2. 挂载vNPU到容器的步骤请参见挂载vNPU

Atlas 推理系列产品

  • 静态虚拟化
  • 动态虚拟化:
    • 使用Ascend Docker Runtime挂载
    • 使用Kubernetes挂载

Atlas 训练系列产品

  • 静态虚拟化
  • 动态虚拟化(使用Ascend Docker Runtime挂载)

在物理机划分vNPU,挂载vNPU到虚拟机,在虚拟机内将vNPU挂载到容器

  1. 在物理机划分vNPU和挂载vNPU到虚拟机的步骤请参见《Atlas 系列硬件产品 24.1.0 虚拟机配置指南》的“安装虚拟机>配置NPU直通虚拟机>vNPU直通虚拟机”章节
  2. 在虚拟机内挂载vNPU到容器的步骤请参见挂载vNPU
Atlas 推理系列产品
  • Atlas 300I Pro 推理卡
  • Atlas 300V 视频解析卡
  • Atlas 300V Pro 视频解析卡
  • Atlas 300I Duo 推理卡

静态虚拟化

在物理机直通NPU到虚拟机,在虚拟机内划分vNPU,再将vNPU挂载到虚拟机内的容器

  1. 在物理机直通NPU到虚拟机的步骤请参见《Atlas 系列硬件产品 24.1.0 虚拟机配置指南》的“安装虚拟机>配置NPU直通虚拟机>NPU直通虚拟机”章节
  2. 在虚拟机内划分vNPU步骤请参见创建vNPU
  3. 将vNPU挂载到虚拟机内的容器的步骤请参见挂载vNPU

Atlas 推理系列产品

  • Atlas 300I Pro 推理卡
  • Atlas 300V 视频解析卡
  • Atlas 300V Pro 视频解析卡
  • Atlas 300I Duo 推理卡
  • 静态虚拟化
  • 动态虚拟化:
    • 使用Ascend Docker Runtime挂载
    • 使用Kubernetes挂载

vNPU挂载到容器方案

将vNPU挂载到容器有以下方案: