昇腾故障案例详情页

NPU模组不在位或PCIe建链失败或HCCS链路报错,需要重新插拔连接器或更换模组板的场景时,需使用清洁工具清洁UBC、MEZZ等高速连接器

更新时间: 2024/02/21

暂无评分

问题信息

问题来源产品大类产品子类关键字
官方安装部署硬件(Atlas 800T A2 训练服务器)NPU模组不在位 PCIe建链失败 HCCS链路报错

问题描述

清洁UBC、MEZZ等高速连接器,即当NPU模组出现不在位,或者PCIe建链失败,或者HCCS链路报错的问题,需要重新插拔连接器或更换模组板时需做的动作。

解决方案

  1. 用蓝光手电照射连接器上是否有异物,异物为红色箭头所示的蓝色荧光点,如图1 UBC公端异物示意图图2图3所示。蓝光手电示意图和购买方式如表2中所示。

    图1 UBC公端异物示意图
    图2 UBC母端异物示意图
    图3 MEZZ连接器异物示意图

  2. 先使用除尘球将蓝色荧光点异物吹掉。吹尘球示意图如表2中所示。
  3. 若存在除尘球吹不掉异物情况时,使用尖头镊子将异物拨掉。pin针不能歪斜(如图4 pin针歪斜现象示意图红框中所示)。尖头镊子示意图和购买方式如表2中所示。

    图4 pin针歪斜现象示意图

  4. 异物清理掉以后,使用带无水酒精的无尘布清洁UBC公端金手指pin(UBC母端、MEZZ连接器不用无尘布清洁),清洁完成以后再使用蓝光手电进行异物检测,确保没有异物再进行安装。
表2 清洁工具列表

工具名称

图片

蓝光手电

除尘球

尖头镊子

本页内容

该页面对您有帮助吗?
我要评分