昇腾社区首页
中文
注册

带外通信查询异常

适用场景

  • 业务场景:DVPP,昇腾模型算法,模型转化,精度调优、应用/算子开发,性能调优、TensorFlow训练
  • 适用处理器:Atlas 200/300/500 推理产品Atlas 推理系列产品Atlas 训练系列产品
  • 处理器形态:EP、RC

现象描述

通过BMC(Baseboard Management Controller)查询昇腾AI处理器相关状态,如温度、功耗等,查询失败,Device侧日志提示如下图所示。

图1 查询状态失败

可能原因

  • 昇腾AI处理器内部查询失败,导致无法给MCU返回正确结果。
  • BMC的I2C通信线路异常,此时所有向昇腾AI处理器查询的命令都返回失败。

处理步骤

针对上述可能原因,可以参考以下方法处理:

  1. 查看返回信息,根据返回的错误码确认原因并处理,返回值列表表1所示。
    表1 异常返回码

    错误码

    错误码含义

    原因

    1

    获取数据超时。

    设备侧出现异常,无法正常响应数据。

    2

    没有找到对应CMD的响应数据。

    该查询CMD不支持。

    3

    该CMD的数据不可用。

    该查询CMD数据不可用。

    4

    请求数据和相应数据长度不一致。

    请求数据长度不对。

    5

    其他错误。

    请求数据异常或者Device异常。

  2. 如果所有查询命令都返回失败,则判断为通信线路异常,需联系技术支持处理。