应用场景及方案

应用场景

昇腾虚拟化实例功能适用于多用户多任务并行,且每个任务算力需求较小的场景。对算力需求较大的大模型任务,不支持使用昇腾虚拟化实例。

虚拟化场景

昇腾虚拟化实例功能在物理机或虚拟机使用时,支持以下虚拟化场景,如表1所示。本文主要介绍在昇腾设备划分vNPU支持的场景和方法,如果涉及虚拟机相关的配置,需要结合另一本文档Atlas硬件产品 虚拟机配置指南一起使用。

表1 使用场景

昇腾虚拟化实例功能支持场景

支持昇腾硬件

操作流程

在物理机划分vNPU,挂载vNPU到虚拟机

Atlas 推理系列产品

  • Atlas 300I Pro 推理卡
  • Atlas 300V 视频解析卡
  • Atlas 300V Pro 视频解析卡
Atlas 训练系列产品
  • Atlas 800 训练服务器(型号 9000)
  • Atlas 800 训练服务器(型号 9010)

在物理机划分vNPU和挂载vNPU到虚拟机的步骤请参见Atlas硬件产品 虚拟机配置指南中的“安装虚拟机 > 配置NPU直通虚拟机 > vNPU直通虚拟机”。

在物理机划分vNPU,挂载vNPU到容器

  • 所有Atlas 推理系列产品
  • 所有Atlas 训练系列产品
  1. 在物理机划分vNPU的步骤请参见创建vNPU
  2. 挂载vNPU到容器的步骤请参见挂载vNPU

在物理机划分vNPU,挂载vNPU到虚拟机,在虚拟机内将vNPU挂载到容器

Atlas 推理系列产品
  • Atlas 300I Pro 推理卡
  • Atlas 300V 视频解析卡
  • Atlas 300V Pro 视频解析卡
  1. 在物理机划分vNPU和挂载vNPU到虚拟机的步骤请参见Atlas硬件产品 虚拟机配置指南中的“安装虚拟机 > 配置NPU直通虚拟机 > vNPU直通虚拟机”。
  2. 在虚拟机内挂载vNPU到容器的步骤请参见挂载vNPU

在物理机直通NPU到虚拟机,在虚拟机内划分vNPU,再将vNPU挂载到虚拟机内的容器

Atlas 推理系列产品

  • Atlas 300I Pro 推理卡
  • Atlas 300V 视频解析卡
  • Atlas 300V Pro 视频解析卡
  1. 在物理机直通NPU到虚拟机的步骤请参见Atlas硬件产品 虚拟机配置指南中的“安装虚拟机 > 配置NPU直通虚拟机 > NPU直通虚拟机”。
  2. 在虚拟机内划分vNPU步骤请参见创建vNPU
  3. 将vNPU挂载到虚拟机内的容器的步骤请参见挂载vNPU

vNPU挂载到容器方案

将vNPU挂载到容器有以下方案: