昇腾故障案例详情页

Atlas 800-3010 EFI启动下Emulex 8G / 16G (lpe1200x/1600系列)FC卡开机启动串口或者屏幕会报Assert的打印

更新时间: 2022/03/03

暂无评分

问题信息

问题来源产品大类产品子类关键字
实验室安装部署驱动固件Assert、EFI、FW

问题现象描述

开机启动时出现Assert

关键过程、根本原因分析

厂商老的FW版本在EFI签名证书有误,需要升级新的版本:

合入版本为

结论、解决方案及效果

升级新的FW版本到11.4.204.20

经验总结、预防措施和规范建议

备注

问题信息

表1-1 问题的基本信息

信息名称

信息内容

问题来源

兼容性列表遗留问题

该案例适用于

XL710芯片的网卡

输出时间

2018/01/11

关键词

网卡物理连接状态

问题现象描述

对XL710芯片的网卡。使用命令”ifconfig enpxxx down”之后,网卡的状态灯依然亮着,并且直连的辅助端网卡link依然为”YES”状态,网卡物理层没有断开。

被测网卡截图:

直连辅助网卡截图:

关键过程、根本原因分析

需要打开网卡“link-down-on-close”开关才能down掉物理层。

结论、解决方案及效果

使用如下命令已解决,网卡物理层成功通过命令断开。

  1. ethtool --set-priv-flags ethxxx link-down-on-close on
  2. Ifconfig enpxxx down

效果截图如下:

被测网卡:

直连辅助网卡截图:

经验总结、预防措施和规范建议

备注

问题信息

表1-1 问题的基本信息

信息名称

信息内容

问题来源

兼容性列表遗留问题

该案例适用于

X722网卡

输出时间

2018/03/28

关键词

队列、中断数

问题现象描述

环境:1288H V5服务器上CPU虚拟核数为104。

ethtool –l eth4查询网口最大为128,X722驱动及固件版本截图如下:

操作步骤及截图如下:

  1. ethtool –L eth4 combined 104
  2. ethtool –l eth4
  3. cat /proc/interrupts|grep –i eth4|wc –l

由上可见,ethtool查询出来X722网卡队列成功修改成了104,但是在中断文件下获取的中断数还是为77,还有部分队列未分配到中断。同样的操作对比x710网卡,队列数跟中断数都成功修改成104。

关键过程、根本原因分析

对此Intel的Steven给出了解释。

结论、解决方案及效果

因为722支持iwarp,需要预留42个vectors给iwarp feature. 然后再预留8个给VMDQ, 再1个给FD_SB(Sideband Flow Director filters)。

在初始化x722时,一开始是一共129个irq vectors,128-42-8-1=77 个给LAN Queue Pairs了。

经验总结、预防措施和规范建议

备注

问题信息

表1-1 问题的基本信息

信息名称

信息内容

问题来源

DTS2018060400932

该案例适用于

Mellanox MZ612 网卡 PowerCycle 丢端口

输出时间

2018/08/30

关键词

Mellanox、powercycle、丢端口

问题现象描述

CH225 V5进行常温验证MZ612 powercycle测试多次后,OS下查询IB网口有两个丢失。

关键过程、根本原因分析

1.WQ_MEM_RECLAIM会创建一个rescuer线程,用于在内存不足时,可以正常分配内核线程

2. 在SLES的内核中,出现的问题发生在kthread_create_on_node中,线程有可能由于为其他内核线程分配内存时,被OOM killer杀掉rescuer线程

结论、解决方案及效果

Mellanox认为添加WQ_MEM_RECLAIM是社区决定,他们不会更改驱动

经验总结、预防措施和规范建议

出现问题后,重启IB驱动可以恢复:/etc/init.d/openibd restart

备注

本页内容

该页面对您有帮助吗?
我要评分