NPU模组不在位或PCIe建链失败或HCCS链路报错,需要重新插拔连接器或更换模组板的场景时,需使用清洁工具清洁UBC、MEZZ等高速连接器
2024/02/21
144
问题信息
问题来源 | 产品大类 | 产品子类 | 关键字 |
---|---|---|---|
官方 | 安装部署 | 硬件(Atlas 800T A2 训练服务器) | NPU模组不在位 PCIe建链失败 HCCS链路报错 |
问题描述
清洁UBC、MEZZ等高速连接器,即当NPU模组出现不在位,或者PCIe建链失败,或者HCCS链路报错的问题,需要重新插拔连接器或更换模组板时需做的动作。
解决方案
- 用蓝光手电照射连接器上是否有异物,异物为红色箭头所示的蓝色荧光点,如图1 UBC公端异物示意图、图2和图3所示。蓝光手电示意图和购买方式如表2中所示。
- 先使用除尘球将蓝色荧光点异物吹掉。吹尘球示意图如表2中所示。
- 若存在除尘球吹不掉异物情况时,使用尖头镊子将异物拨掉。pin针不能歪斜(如图4 pin针歪斜现象示意图红框中所示)。尖头镊子示意图和购买方式如表2中所示。
- 异物清理掉以后,使用带无水酒精的无尘布清洁UBC公端金手指pin(UBC母端、MEZZ连接器不用无尘布清洁),清洁完成以后再使用蓝光手电进行异物检测,确保没有异物再进行安装。
本页内容