执行HCCL Test测试工具时,报“This is an error in init_hcclComm”的错误,如下图所示:
某些卡被进程占用,导致无法使用HCCL Test工具进行测试。
某些场景下,npu-smi info未显示卡被占用,但片上内存使用非常高,此种情况下,也会引起HCCL Test测试工具执行失败。
for i in {0..7}; do hccn_tool -i $i -process -g ; done