开发者
资源

资源监测

功能特点

支持在执行训练或者推理任务,对昇腾AI处理器资源各种指标的实时监测,可实时获取昇腾AI处理器利用率、温度、电压、内存,以及昇腾AI处理器在容器中的分配状况等信息,实现资源的实时监测。支持对Atlas 推理系列产品的虚拟NPU(vNPU)的AI Core利用率、vNPU总内存和vNPU使用中内存进行监测。

所需组件

  • MindCluster Ascend Device Plugin
  • MindCluster Ascend Docker Runtime
  • MindCluster NPU Exporter
  • MindCluster ClusterD

使用说明

  1. 安装组件请参考安装部署章节进行操作。
  2. 特性使用指导请参考资源监测章节进行操作。