AICORE类问题定位通用方法
通用定位问题步骤
- 收集/var/log/ascend/ascend-dmi.log文件,搜索如下包含“ret =”的相关日志,记录其“进程号”及“返回码”。
- 若使用CANN 8.0.RC2及之后的版本,收集plog日志;若使用CANN 8.0.RC2之前的版本,收集Messages日志。收集方法请见plog日志及Message日志。
查找对应进程号的日志,查看AML相关报错信息。其中case name为算子用例名,error code为错误码。
- 根据查询的error code错误码,按照如下表格进行典型问题排查处理。
错误码
错误码说明
100000
输入参数异常。
100001
无效的Device ID。
100002
AML框架后处理失败。
100003
AML框架前处理失败。
100004
不支持并发操作。
100005
未找到对应压测用例。
100006
压测被异常中断。
100007
ACL库或接口调用失败。
100008
算子用例前处理失败。
100009
算子用例后处理失败。
100010
恢复接口调用失败。
100011
不支持ASCEND_RT_VISIBLE_DEVICES环境变量使用。
110000
用例执行失败。
110001
用例执行流同步超时。
120000
局部资源类错误。
120001
驱动版本不匹配。
120002
芯片类型不支持。
120003
用例执行内存不足。
120004
用例执行失败,未找到压测算子。
130000
用例执行失败。
130001
压测算子执行超时。
140000
全局资源类错误。
190001
压测环境设置失败。
190002
压测环境恢复失败。
父主题: AICORE诊断/压测类