虚拟机复位时长过长,且出现soft lockup信息
问题描述
Atlas 800 训练服务器(型号:9000)、Atlas 800 训练服务器(型号:9010)直通虚拟机场景下,覆盖安装驱动包,驱动安装成功,但出现打印BUG:soft lockup - CPU stuck,如图1所示。
可能原因
宿主机Linux内核4.19.144~5.12.10版本引入了kvm_unmap_hva_handler进行解映射,导致虚拟机内芯片复位时间较长,watchdog kthread得不到调度,于是报了soft lockup。
解决方案
可以通过回退宿主机Linux内核到4.19.143及以下版本,或升级到5.13.0及以上版本解决耗时问题。
父主题: FAQ