当前各处理器及型号包含的硬件资源如表1所示。
处理器型号 |
AI Core核数 |
内存 |
AICPU |
VPC总核数 |
VDEC总核数 |
JPEGD总核数 |
PNGD总核数 |
VENC总核数 |
JPEGE总核数 |
---|---|---|---|---|---|---|---|---|---|
Atlas 训练系列产品(30个AI Core) |
30 |
32G |
14 |
16 |
16 |
16 |
24 |
NA |
8 |
Atlas 训练系列产品(32个AI Core) |
32 |
32G |
14 |
16 |
16 |
16 |
24 |
NA |
8 |
Atlas 推理系列产品(8个AI Core) |
8 |
24G |
7 |
12 |
12 |
16 |
NA |
3 |
8 |
昇腾AI处理器包含AI Core、AI CPU、DVPP、内存等硬件资源,主要用途如下:
产品型号 |
虚拟化实例模板 |
说明 |
---|---|---|
Atlas 训练系列产品(30或32个AI Core) |
虚拟化实例模板包括:vir02、vir04、vir08、vir16。 |
|
Atlas 推理系列产品(8个AI Core) |
虚拟化实例模板包括:vir01、vir02、vir04、vir02_1c、vir04_3c、vir04_3c_ndvpp、vir04_4c_dvpp。 说明:
Atlas 300I Duo 推理卡的2P场景下(即存在2张NPU卡),p0对应的虚拟化实例模板如上所示,p1对应的虚拟化实例模板名称需要在p0的基础上增加p1的标记,比如p1_vir01。 |
|
处理器型号 |
虚拟化实例模板 |
AI Core核数 |
内存 |
AI CPU |
VPC |
VDEC |
JPEGD |
PNGD |
VENC |
JPEGE |
---|---|---|---|---|---|---|---|---|---|---|
Atlas 训练系列产品(30或32个AI Core) |
vir16 |
16 |
16G |
7 |
8 |
8 |
8 |
12 |
NA |
4 |
vir08 |
8 |
8G |
3 |
4 |
4 |
4 |
6 |
NA |
2 |
|
vir04 |
4 |
4G |
1 |
2 |
2 |
2 |
3 |
NA |
1 |
|
vir02 |
2 |
2G |
1 |
1 |
1 |
1 |
1 |
NA |
0 |
|
Atlas 推理系列产品(8个AI Core) |
vir04 |
4 |
12G |
4 |
6 |
6 |
8 |
NA |
2 |
4 |
vir04_3c |
4 |
12G |
3 |
6 |
6 |
8 |
NA |
1 |
4 |
|
vir02 |
2 |
6G |
2 |
3 |
3 |
4 |
NA |
1 |
2 |
|
vir02_1c |
2 |
6G |
1 |
3 |
3 |
4 |
NA |
0 |
2 |
|
vir01 |
1 |
3G |
1 |
1 |
1 |
2 |
NA |
0 |
1 |
|
vir04_3c_ndvpp |
4 |
12G |
3 |
0 |
0 |
0 |
NA |
0 |
0 |
|
vir04_4c_dvpp |
4 |
12G |
4 |
12 |
12 |
16 |
NA |
3 |
8 |
Atlas 推理系列产品支持虚拟化实例组合如图1所示,1个昇腾AI处理器最大支持切分7个虚拟化实例,用户需要按照组合规格对NPU硬件资源进行虚拟化切分。
由于Atlas 推理系列产品只配置7个AI CPU,因此导致对Atlas 推理系列产品进行虚拟化时,无法做到资源均衡的划分vNPU,vNPU支持的划分组合如图1所示,因此您在使用Atlas 推理系列产品进行虚拟化实例功能前,需要评估现场服务器上推理应用所需的资源要求,比如划分6个vir01后,无法再切分2个vir01,只能再划分一个vir02_1c(或者一个vir01,但是会浪费一个AI Core),所以建议您的推理应用正式使用vNPU前,可以先划分vNPU进行测试验证,找到最佳的切分策略。
如果您需要了解典型模型在vNPU上推理的性能数据,您可以联系华为技术支持工程师获取信息。
Atlas 训练系列产品的虚拟化实例组合不一一列举,虚拟化机制为在一个NPU上创建的虚拟实例包含的AIcore数量达到了NPU实际AIcore数量后就不能够继续切分,如昇腾AI处理器为30个AICore时,则不能切分两个vir16,只能切分一个vir16,剩余的14个AICore则可以按照vir08+vir04+vir02切分,而昇腾AI处理器为32个AICore时,则支持两个vir16。昇腾AI处理器为30个AICore时,最大支持切分15个虚拟化实例,昇腾AI处理器为32个AICore时,最大支持切分16个虚拟化实例。
Atlas 训练系列产品只支持软件虚拟化方式,而Atlas 推理系列产品中vir04、vir04_3c、vir02、vir02_1c、vir04_3c_ndvpp、vir04_4c_dvpp模板为硬件虚拟化模式,vir01模板为软件虚拟化模式。
Atlas 推理系列产品虚拟化实例还涉及vGroup的概念: