昇腾社区首页
中文
注册

Atlas 300I Pro算力切分使用注意事项

  • 部署pod应用时,可以为容器分配NPU资源,如果NPU资源为切分后的vNPU,则一个容器只能分配1个vNPU,如果分配了多个vNPU,将会导致部署失败并返回如下信息:
    FAILED:container [container-0] vNPU=[2] exceed max value:[1],each container can only allocate [1] vNPU

    如上报错信息表示,每个容器只能分配1个vNPU,但用户实际分配了2个。

  • 当部署的NPU资源未切分时,一个容器可分配多个NPU资源。
  • 当前NPU算力切分仅支持静态切分,需要用户先行将NPU资源切分完成,再启动AtlasEdge。在AtlasEdge运行过程中对NPU资源进行切分销毁等操作会导致NPU资源无法被正确识别。
  • 现不支持不同推理卡混插场景。