昇腾社区首页
中文
注册
开发者
下载

PRBS码流诊断

测试项功能

通过对NPU芯片的RoCE网口收发PRBS码流,诊断硬件链路的通信信号质量。

PRBS码流诊断支持以下2种打流方式:
  • CDR环回打流:请参见测试原理
  • 光模块外接光纤回路器(自环器)打流:请参见测试原理
表1 诊断项说明

诊断项名称

使用Atlas A2 训练或推理系列产品完成一轮诊断的参考耗时

使用Atlas A3 训练或推理系列产品完成一轮诊断的参考耗时

是否影响NPU训练或推理

使用场景

prbs码流诊断

3s~10s

2min~5min

定位RoCE网口信号质量问题。

测试项特定参数查询

各参数解释如表2所示,表格内仅展示测试项特定参数,其余公共参数请参见公共参数说明

表2 参数说明

参数

说明

是否必填

[-i, --items]

指定具体的诊断检查项:
  • prbs :码流诊断。

[-td, --td, --trans-duration]

指定RoCE端口prbs码流诊断的时长。

  • 仅支持items指定prbs时,此参数才可使用。
  • 参数取值范围为[3,10],单位为秒。不指定该参数时,默认为3秒。

使用实例

ascend-dmi -dg -i prbs -q

指定RoCE端口prbs码流诊断的时长为5时,示例如下:

1
2
3
4
5
6
7
8
9
[***@***]# ascend-dmi -dg -i prbs --td 5 -q
Summary:
    Arch: aarch64
    Mode: ******
    Time: 20250530-10:43:21
 
Hardware:
    prbs:
        PASS

故障检查项说明

表3 故障检查项说明

回显状态

含义

IMPORTANT_WARN

重要警告

RoCE端口存在误码,且误码率大于10-5,请联系华为工程师处理。

SKIP

当前产品/场景不支持该功能。

PASS

码流检测通过。RoCE端口信号质量正常(误码率小于10-5)。

FAIL

  • 码流检测失败。
  • 诊断结果为满误码(误码数为67092480)。