昇腾社区首页
中文
注册

驱动健康诊断

测试项功能

对驱动的健康状态进行诊断,并输出诊断结果。

表1 诊断项说明

诊断项名称

参考耗时

是否影响NPU训练或推理

使用场景

驱动健康诊断

2s~7s

训练或推理业务上线。

测试项特定参数查询

各参数解释如表2所示,表格内仅展示测试项特定参数,其余公共参数请参见公共参数说明

表2 参数说明

参数

说明

是否必填

[-i, --items]

指定具体的诊断检查项:
  • 指定驱动健康诊断,取值为driver。

使用实例

ascend-dmi -dg -i driver

1
2
3
4
5
6
7
8
9
[***@***]# ascend-dmi -dg -i driver
Summary:
    Arch: aarch64
    Mode: ******
    Time: 20250529-19:19:35
 
Hardware:
    driver:
        HEALTH

故障检查项说明

表3 故障检查项说明

回显状态

含义

HEALTH

驱动固件安装正常,并且驱动状态为健康

GENERAL_WARN

一般警告(警告内容参考界面中提示的错误信息)

IMPORTANT_WARN

重要警告(警告内容参考界面中提示的错误信息)

EMERGENCY_WARN

紧急警告(警告内容参考界面中提示的错误信息)

FAIL

  • 驱动或固件安装异常
  • 读取驱动健康状态失败