昇腾社区首页
中文
注册

AICPU压测

测试项功能

测试指定Device的AICPU指令执行是否符合预期,并输出测试结果。

表1 诊断项说明

诊断项名称

参考耗时

是否影响NPU训练或推理

使用场景

AICPU压力测试

默认约5min

AICPU故障导致宕机卡死。

测试项特定参数查询

各参数解释如表2所示,表格内仅展示测试项特定参数,其余公共参数请参见公共参数说明

表2 参数说明

参数

说明

是否必填

[-i, --items]

指定具体的诊断检查项:
  • aicpu:AICPU ERROR压测。

[-st, --st, --stress-time]

指定AICPU压力测试的时间。

  • 取值范围是[60,604800],单位为秒。

使用实例

AICPU压测,以指定执行时长60s为例:

1
2
3
4
5
6
7
8
9
[***@***]# ascend-dmi -dg -i aicpu -s -st 60 -q
Summary:
    Arch: aarch64
    Mode: ******
    Time: 20250529-19:56:52
 
Hardware:
    aicpu:
        PASS

故障检查项说明

表3 故障检查项说明

回显状态

含义

PASS

压力测试结果无异常。

SKIP

  • 执行压测的用户为非root用户。
  • 当前设备不支持AICPU压测。

EMERGENCY_WARN

紧急警告,请更换硬件。

FAIL

AICPU压测失败,请联系华为工程师处理。