Aicore压测
测试项功能
对AICore ERROR进行压力测试,并输出诊断结果。
支持的场景
AICore ERROR(以下简称aicore)压测支持的设备及场景如表2所示。(在下表中,Y表示支持,N表示不支持。)
使用约束
测试前准备
- 执行aicore压测前,需已安装Atlas A2 训练系列产品配套的Ascend HDK 23.0.0及以后版本的MCU、驱动和固件。
- aicore压测依赖CANN 7.0.0及以后版本的开发套件包Ascend-cann-toolkit和Atlas A2 训练系列产品配套的二进制算子包Ascend-cann-kernels,在执行压力测试前需参考环境配置安装所需的软件包,并配置环境变量。
- 在执行aicore压测前,建议提前在环境上安装fuser软件,以便Ascend DMI对NPU进程进行监测。
测试项参数查询
各参数解释如表3所示。
参数 |
说明 |
是否必填 |
---|---|---|
[-dg, --dg, --diagnosis] |
使用该参数进行整卡的故障诊断测试。 |
是 |
[-i, --items] |
指定具体的诊断检查项:
|
是 |
[-s, --stress] |
使用该参数进行压力测试,当前支持指定的压力测试有以下几种:片上内存压测、Aicore压测、P2P压测、功耗压测。
|
是 |
[-d, --device] |
指定需要进行诊断测试的Device ID,Device ID是指昇腾芯片的逻辑ID。
|
否 |
[-sc, --sc, --stress-count] |
指定Aicore压测的次数。
|
否 |
[-r, --result] |
指定故障诊断结果和信息采集结果的保存路径,如:/test。指定的路径需符合安全要求,且不支持包含通配符“*”。
|
否 |
[-fmt, --fmt, --format] |
指定输出格式,可以为normal或json。若未指定则默认为normal。 |
否 |
[-q, --quiet] |
|
否 |
注:
|
使用实例
1 | ascend-dmi -dg -i aicore -s -sc 60 -q |
故障检查项说明
回显状态 |
含义 |
---|---|
PASS |
压力测试结果无异常。 |
SKIP |
|
EMERGENCY_WARN |
紧急警告,请更换硬件。 |
FAIL |
Aicore压测失败,请联系华为工程师处理。 |
父主题: 故障诊断