通过命令行使用(其他调度器)和通过命令行使用(Volcano)使用流程一致,只有任务YAML有所不同,用户可以准备好相应YAML后参考通过命令行使用(Volcano)章节使用。
任务类型 |
硬件型号 |
YAML文件名称 |
获取链接 |
---|---|---|---|
K8s或其他调度器场景下的Job任务 |
Atlas 200I SoC A1 核心板 |
infer-310p-1usoc.yaml |
|
其他类型推理节点 |
infer.yaml |
参数 |
取值 |
说明 |
---|---|---|
image |
- |
推理镜像名称,请根据实际修改(用户在制作镜像章节制作的镜像名称)。 |
replicas |
整数 |
运行的任务副本数量。通常情况一般为1。 |
requests |
如:huawei.com/Ascend310: 1 |
请求的NPU类型、数量,请根据实际修改。requests和limits下,芯片的名字和数量需保持一致。 |
limits |
||
(可选)host-arch |
Arm环境:huawei-arm x86_64环境:huawei-x86 |
需要运行推理任务的节点架构,请根据实际修改。Atlas 200I SoC A1 核心板节点仅支持huawei-arm。 |
servertype |
soc |
服务器类型。
|
特性名称 |
操作参考 |
---|---|
整卡调度 |
|
静态vNPU |
apiVersion: batch/v1 kind: Job metadata: name: resnetinfer1-1 spec: template: spec: nodeSelector: host-arch: huawei-arm # 可选值,根据实际情况填写 affinity: # 本段表示不调度到Atlas 200I SoC A1 核心板节点 nodeAffinity: requiredDuringSchedulingIgnoredDuringExecution: nodeSelectorTerms: - matchExpressions: - key: servertype operator: NotIn values: - soc containers: - image: ubuntu-infer:v1 ... resources: requests: huawei.com/Ascend310P: 1 limits: huawei.com/Ascend310P: 1 ...
apiVersion: batch/v1
kind: Job
metadata:
name: resnetinfer1-1-1usoc
spec:
template:
spec:
nodeSelector:
host-arch: huawei-arm # 可选值,根据实际情况填写
servertype: soc # 该标签表示仅能调度到Atlas 200I SoC A1 核心板节点
containers:
- image: ubuntu-infer:v1
...
resources:
requests:
huawei.com/Ascend310P: 1
limits:
huawei.com/Ascend310P: 1
...
因为Atlas 200I SoC A1 核心板节点需要挂载的目录和文件与其他类型节点不一致,为了避免推理失败,如果需要使用Atlas 推理系列产品,且集群中有Atlas 200I SoC A1 核心板节点但是不希望调度到这类节点上,请在示例的YAML中增加“affinity”字段,表示不调度到有“servertype=soc”标签的节点上。
apiVersion: batch/v1 kind: Job metadata: name: resnetinfer1-1 spec: template: spec: nodeSelector: host-arch: huawei-arm # 可选值,根据实际情况填写 ... containers: - image: ubuntu-infer:v1 ... resources: requests: huawei.com/Ascend910: 1 limits: huawei.com/Ascend910: 1 ...
apiVersion: batch/v1 kind: Job metadata: name: resnetinfer1-1 spec: template: spec: nodeSelector: host-arch: huawei-arm # 可选值,根据实际情况填写 containers: - image: ubuntu-infer:v1 ... resources: requests: huawei.com/Ascend310P-2c: 1 limits: huawei.com/Ascend310P-2c: 1 ...