资源申请约束 根据业务模型,对此类推理任务作如下要求: 推理任务申请的昇腾AI处理器数量不能大于节点昇腾AI处理器总数。当推理任务申请的昇腾AI处理器数量小于或等于2个时,需要将推理任务调度到同一张Atlas 300I Duo 推理卡内。当使用分布式推理时,任务所有副本只能部署在同一节点内,申请的总昇腾AI处理器数量不能大于节点昇腾AI处理器总数。遵循Volcano开源部分的其他约束。 父主题: 推理服务器(插Atlas 300I Duo 推理卡)