边缘场景对Atlas 300I Pro推理卡算力切分的支持
算力切分现有切分组合请参考中的《昇腾虚拟化实例(AVI)用户指南》“虚拟化规则 > 虚拟化实例组合”章节。
当有NPU资源被切分为vNPU时或者多个NPU资源中的部分资源被切分为vNPU时,AtlasEdge只会识别其中一种规格的资源。
识别规则
- 当有多种类型资源时,识别并上报数量最多的资源。
- 当两种或多种资源数量一致时,识别并上报能力最大的资源。
使用示例
示例1:当只有1个NPU(1张Atlas 300I Pro推理卡)且被切分为:vir02、vir02、vir02、vir02_1c,识别并上报数量最多的资源为3个vir02。
示例2:当有5个NPU(5张Atlas 300I Pro推理卡)且其中1个NPU被切分为vir02、vir02、vir02、vir02_1c。因NPU的数量最多,因此识别并上报数量最多的资源为4个NPU。
父主题: 边缘场景算力切分支持说明