资源监测

功能特点

支持在执行训练或者推理任务时,对昇腾AI处理器资源各种数据信息的实时监测,可实时获取昇腾AI处理器利用率、温度、电压、内存,以及昇腾AI处理器在容器中的分配状况等信息,实现资源的实时监测。支持对Atlas 推理系列产品的虚拟NPU(vNPU)的AI Core利用率、vNPU总内存和vNPU使用中内存进行监测。

所需组件

NPU Exporter

使用说明

  1. 安装组件请参考安装部署章节进行操作。
  2. 特性使用指导请参考资源监测章节进行操作。