单机Hccl test带宽峰值稳定低于预期值(预期值可以参见Ascend Training Solution中对应产品的《集群交付一本通》中“单机测试 > 测试方案 > 测试规格”)。
export ASCEND_GLOBAL_LOG_LEVEL=3 // (0:debug 1:info 2:warning 3:error)
Device侧日志操作:
# 查询 for i in {0..7}; do /usr/local/Ascend/driver/tools/msnpureport -r -d $i; done # 设置 for i in {0..7}; do msnpureport -g error -d $i; done
测选卡测某条链路:
ascend-dmi --bw -t p2p --ds 0 --dd 8
测全量p2p:
ascend-dmi --bw -t p2p #测试时间较长预计20分钟
然后在昇腾社区提issue解决。