NPU Exporter
应用场景
在任务运行过程中,除芯片故障外,往往需要关注芯片的网络和算力使用情况,以便确认任务运行过程中的性能瓶颈,找到提升任务性能的方向。MindCluster提供了部署在计算节点的NPU Exporter组件,用于上报芯片的各项数据信息。
组件功能
- 从驱动中获取芯片、网络的各项数据信息。
- 适配Prometheus钩子函数,提供标准的接口供Prometheus服务调用。
- 适配Telegraf钩子函数,提供标准的接口供Telegraf服务调用。
组件上下游依赖
图1 组件上下游依赖


- 从驱动中获取芯片以及网络信息,并放入本地缓存。
- 从K8s标准化接口CRI中获取容器信息,并放入本地缓存。
- 实现Prometheus或者Telegraf的接口,供二者周期性获取缓存中的数据信息。
父主题: 组件介绍