设备纳管场景

场景介绍

该场景适用于用户已经有一个部署好的Kubernetes集群,希望使用自己的调度器部署NPU任务,并且可以使用NPU设备管理的特性。使用该场景时,需要在新接入的NPU服务器上部署计算节点(Worker)的NPU管理组件。

安装组件列表

表1 设备纳管场景安装组件列表

组件

是否必选

功能说明

Ascend Docker Runtime

必选

支持容器使用昇腾NPU。

Ascend Device Plugin

必选

支持NPU设备管理功能。

NPU-Exporter

可选

需要使用NPU设备管理中的状态监测功能时安装。

组件部署方式说明

安装步骤

  1. 参考软件包说明,获取安装组件的软件包。
  2. 安装Ascend Docker Runtime,具体操作请参见安装Ascend Docker Runtime
  3. 参考制作镜像制作组件的镜像。

    NPU-Exporter选择使用二进制部署,不需要制作组件的镜像可跳过本步骤。

  4. 参考创建用户,在组件部署的节点上创建用户。
  5. 参考创建日志目录,在组件部署的节点上创建对应的日志目录。
  6. 参考创建命名空间,在K8s中创建命名空间。
  7. 参考创建节点标签,给节点打标签。
  8. 参考常用操作章节,启动组件。