昇腾社区首页
中文
注册

AICORE类问题定位通用方法

通用定位问题步骤

  1. 收集/var/log/ascend/ascend-dmi.log文件,搜索如下包含“ret =”的相关日志,记录其“进程号”及“返回码”。

  2. 若使用CANN 8.0.RC2及之后的版本,收集plog日志;若使用CANN 8.0.RC2之前的版本,收集Messages日志。收集方法请见plog日志Message日志

    查找对应进程号的日志,查看AML相关报错信息。其中case name为算子用例名,error code为错误码。

  3. 根据查询的error code错误码,按照如下表格进行典型问题排查处理。

    错误码

    错误码说明

    100000

    输入参数异常。

    100001

    无效的Device ID。

    100002

    AML框架后处理失败。

    100003

    AML框架前处理失败。

    100004

    不支持并发操作。

    100005

    未找到对应压测用例。

    100006

    压测被异常中断。

    100007

    ACL库或接口调用失败。

    100008

    算子用例前处理失败。

    100009

    算子用例后处理失败。

    100010

    恢复接口调用失败。

    100011

    不支持ASCEND_RT_VISIBLE_DEVICES环境变量使用。

    110000

    用例执行失败。

    110001

    用例执行流同步超时。

    120000

    局部资源类错误。

    120001

    驱动版本不匹配。

    120002

    芯片类型不支持。

    120003

    用例执行内存不足。

    120004

    用例执行失败,未找到压测算子。

    130000

    用例执行失败。

    130001

    压测算子执行超时。

    140000

    全局资源类错误。

    190001

    压测环境设置失败。

    190002

    压测环境恢复失败。