PKCS签名问题导致驱动或固件回退失败、npu-smi命令异常或davinci设备无法启动

问题描述1

驱动回退过程中出现图1所示报错信息,执行npu-smi命令异常,查看“ascend_install.log”日志信息,显示图2所示报错:

图1 驱动回退报错
图2 驱动日志信息

固件回退过程中出现图3所示报错,查看“ascend_install.log”日志信息,显示图4所示报错:

图3 固件回退报错
图4 固件日志信息

问题描述2

驱动安装过程中davinci设备无法启动,出现图5所示报错:

图5 davinci设备无法启动

使用msnpureport -f 收集device侧日志,查看“hisi_logs/device-0/20221008103618-286885000/snapshot/hdr.log”日志,出现图6所示校验失败日志信息:

图6 校验失败

可能原因

签名校验失败。

解决方案

  1. 安装NPU 22.0.3及以上版本驱动和配套固件(NPU驱动和固件包名称中包含的版本为6.0.RC1,但是部署驱动和固件后使用npu-smi命令查询获取的驱动版本为22.0.3,固件版本为1.83.10.1.X)。
  2. 设置PKCS的状态为“使能”。执行如下命令:

    npu-smi set -t pkcs-enable -d 0

    如出现如下回显,则表示设置成功。
      [WARNING]: Enabling pkcs will raise safety risks.
            Status                         : OK
            Message                        : The pkcs-enable is set successfully

    具体请参见《Atlas 中心推理卡 23.0.3 npu-smi 命令参考》

  3. 重新执行回退操作。

    先安装22.0.2及之前版本的固件包,此时不能重启。再安装对应版本的驱动包,最后重启(NPU驱动和固件包名称中包含的版本为5.1.RC2,但是部署驱动和固件后使用npu-smi命令查询获取的驱动版本为22.0.2,固件版本为1.82.22.2.X)。

    重启系统后,PKCS的状态会恢复为默认“禁用”状态,设置为“使能”状态后请直接执行回退操作。

  4. 若回退至CANN 5.1.RC2版本及之前的自定义文件系统,回退版本时需同时将/usr/local/CMS下的两个文件修改为版本配套的证书文件,可参考设置用户根证书信息