Atlas 中心推理卡通过FusionDirector升级驱动时,概率性出现升级失败,提示“BMC返回错误信息”
2025/04/10
35
问题信息
问题来源 | 产品大类 | 产品子类 | 关键字 |
---|---|---|---|
现网 | 安装部署 | 驱动固件 | FusionDirector升级、升级失败 |
问题现象描述
通过FusionDirector升级驱动时,概率性出现升级失败,提示“BMC返回错误信息:["{Index_1:{File:Ascend310P-hdk-npu-firmware_5.1.rc2.3.run, Result success,ErrorInfo:NA,ActiveMode:},Index_2:{File:Ascend310P-hdk-npu-driver_5.1.rc2.3_linux-aarch64.run,Result:faile,ErrorInfo:NA,ActiveMode:}}"]”报错信息。
登录Atlas 300I Pro 推理卡/Atlas 300V Pro 视频解析卡所在服务器,使用root用户执行如下命令,查看“/var/log/ascend_seclog/ascend_install.log”日志信息。
cat /var/log/ascend_seclog/ascend_rebuild.log
回显信息如下:
[uid=0(root)] [INFO]Start to set the hot reset flag for all devices. [uid=0(root)] [WARNING]The set hot reset flag failed to take effect. [uid=0(root)] [WARNING]/dev/davinci_manager has user process: 55270 29 ? 00:00:00 npu-smi info -t usages -i 5 -c 0 [uid=0(root)] [WARNING]The set hot reset flag failed to take effect. [uid=0(root)] [WARNING]The set hot reset flag failed to take effect. [uid=0(root)] [ERROR]The davinci nodes are occupied by some processes, please stop processes and install or uninstall again.
原因分析
FusionDirector升级NPU驱动的过程中,iBMA查询了NPU的信息,davinci节点被iBMA占用,导致驱动升级失败。
解决措施
通过FusionDirector重新升级目标版本驱动和固件。