服务器开启lldp,查询邻居信息没有输出
2025/03/07
171
问题信息
问题来源 | 产品大类 | 关键字 |
---|---|---|
现网 | 模型推理 | TLS,HCCL,AllReduce,通信,DeepSeek,推理 |
问题现象描述
多机拉起DeepSeek模型时,服务化拉起卡住。检查网络通信,服务器两边都开启了LLDP,在服务器上执行hccn_tool -i 0 -lldp -g命令,没有任何新邻居信息输出。
原因分析
1. 交换机处没有使能LLDP
前往交换机执行display lldp neighbor brief,如果有如下回显,证明交换机使能了LLDP功能。
2. 交换机端口或者网卡没有UP
现场确认下服务器连接交换机端口物理状态是否正常,物理指示灯是否亮灯。经过现场确认发现物理指示灯没有亮。
解决措施
现场使用的交换机是CE9860,400GE端口使用1分2的光纤连接服务器NPU卡,物理指示灯未亮是因为400GE端口未做拆分,在交换机上执行如下命令行将端口进行拆分,port split dimension interface 400GE 1/1/1 split-type 2*200GE。
拆分后端口物理指示灯亮了,再在服务器上执行hccn_tool -i 0 -lldp -g命令,能够正常显示邻居信息了。