昇腾虚拟化实例功能适用于多用户多任务并行,且每个任务算力需求较小的场景。对算力需求较大的大模型任务,不支持使用昇腾虚拟化实例。
昇腾虚拟化实例功能在物理机或虚拟机使用时,支持以下虚拟化场景,如表1所示。本文主要介绍在昇腾设备划分vNPU支持的场景和方法,如果涉及虚拟机相关的配置,需要结合另一本文档《Atlas 系列硬件产品 24.1.0 虚拟机配置指南》的“安装虚拟机>配置NPU直通虚拟机>NPU直通虚拟机”章节一起使用。
划分vNPU有以下两种方式。
昇腾虚拟化实例功能支持场景 |
操作流程 |
支持昇腾硬件 |
支持的虚拟化方式 |
---|---|---|---|
在物理机划分vNPU,挂载vNPU到虚拟机 |
在物理机划分vNPU和挂载vNPU到虚拟机的步骤请参见《Atlas 系列硬件产品 24.1.0 虚拟机配置指南》的“安装虚拟机>配置NPU直通虚拟机>vNPU直通虚拟机”章节。 |
Atlas 推理系列产品:
|
静态虚拟化 |
|
|||
在物理机划分vNPU,挂载vNPU到容器 |
Atlas 推理系列产品 |
|
|
Atlas 训练系列产品 |
|
||
在物理机划分vNPU,挂载vNPU到虚拟机,在虚拟机内将vNPU挂载到容器 |
Atlas 推理系列产品:
|
静态虚拟化 |
|
在物理机直通NPU到虚拟机,在虚拟机内划分vNPU,再将vNPU挂载到虚拟机内的容器 |
Atlas 推理系列产品:
|
|
将vNPU挂载到容器有以下方案:
不支持通过原生Containerd拉起容器时将vNPU挂载到容器。