昇腾社区首页
中文
注册

资源申请约束

根据业务模型,对推理任务作如下要求:

  • 推理任务申请的昇腾AI处理器数量不能大于节点昇腾AI处理器总数。
  • 当推理任务申请的昇腾AI处理器数量小于或等于4个时,需要将推理任务调度到同一张Atlas 300I 推理卡内。
  • 遵循Volcano开源部分的其他约束。