查看任务进程
操作步骤
- 执行以下命令,查看Pod运行状况。
kubectl get pod --all-namespaces
回显示例如下:
NAMESPACE NAME READY STATUS RESTARTS AGE ... default resnetinfer1-2-scpr5 1/1 Running 0 8s ...
- 执行以下命令,查看运行推理任务的节点详情。
kubectl describe node <hostname>
例如:kubectl describe node ubuntu
回显示例如下:
... Allocated resources: (Total limits may be over 100 percent, i.e., overcommitted.) Resource Requests Limits -------- -------- ------ cpu 4 (2%) 3500m (1%) memory 2140Mi (0%) 4040Mi (0%) ephemeral-storage 0 (0%) 0 (0%) huawei.com/npu-core 4 4 Events: Type Reason Age From Message ---- ------ ---- ---- ------- Normal Starting 36m kube-proxy, ubuntu Starting kube-proxy. ...
在显示的信息中,找到“Allocated resources”下的huawei.com/npu-core,该参数取值在执行推理任务之后会增加,增加数量为推理任务使用的NPU芯片个数。
父主题: 通过命令行使用(Volcano)