自定义打流

测试项功能

自定义打流是将一键式打流中的各步骤独立出来,用户可灵活控制打流的TX、RX方向开关和指定打流的具体lane。

测试项名称

支持的打流方式

使用方法

自定义打流

CDR环回打流、光模块外接光纤回路器(自环器)打流、NPU直连打流

自定义打流是将一键式打流中的各步骤独立出来,用户可灵活控制打流的TX、RX方向开关和指定打流的具体lane。

一键式打流

CDR环回打流、光模块外接光纤回路器(自环器)打流

执行一键式打流命令,Ascend DMI工具将自动完成发送及接收指定device所有lane的码流,一段时间后关闭码流并查询结果。

测试原理

自定义流支持以下3种打流方式(NPU外部环回场景,包括CDR环回打流和外接光纤回路器打流,也支持两个NPU通过铜缆或者光纤直连的场景)。

使用约束

测试前准备

支持的场景

码流测试支持的设备及场景如表1 支持的场景和产品型号所示。(在下表中,Y表示支持,N表示不支持。)

表1 支持的场景和产品型号

场景/产品型号

Atlas A2 训练系列产品

Atlas 800I A2 推理产品

Atlas A3 训练系列产品

物理机

1

Y

Y

宿主机+容器

1

Y

Y

虚拟机

1

N

N

  1. Atlas 800T A2 训练服务器Atlas 200T A2 Box16 异构子框支持。

测试项参数查询

用户可任选以下指令之一查看码流测试命令的可用参数。

ascend-dmi --prbs-check -h

ascend-dmi --prbs-check --help

各参数解释如表1所示。

在打流前,必须先执行--clear命令清除当前Device寄存器保留的历史信息。

表2 参数说明

参数

说明

是否必填

[-pc, --pc, --prbs-check]

使用该参数进行prbs码流测试。

[-d, --device]

指定需要进行码流测试的Device ID。

  • Device ID是指昇腾AI处理器的逻辑ID,若不填写则测试全量昇腾NPU芯片的码流。
  • 可同时指定多个Device ID,多个之间用逗号隔开。

[--prbs-mode]

是否切换打流状态。

--取值为EN(Enable):开启。

--取值为DS(Disable):关闭。

  • 取值支持大小写。
  • 指定--prbs-mode为EN或DS时,信号发送端和信号接收端两个方向均会生效,无论是否指定--generator-pattern,--generator-lanes,--checker-pattern,--checker-lanes参数。
  • 指定--prbs-mode为EN时,支持指定-generator-pattern、--checker-pattern、--generator-lanes、--checker-lanes。
  • 指定--prbs-mode为DS时,停止打流。不支持指定-generator-pattern、--checker-pattern、--generator-lanes、--checker-lanes。
  • 本参数不支持与--show参数或--clear参数同时指定。

[--generator-pattern]

指定发送端的码流类型。

  • 当前支持测试的码流类型为:prbs7、prbs9、prbs10、prbs11、prbs15、prbs20、prbs23、prbs31。
  • 不指定该参数时,默认值为prbs31。
  • 指定码型时大小写均可生效,例如prbs7也可以写为PRBS7。
  • 本参数不支持与--show参数或--clear参数同时指定。

[--generator-lanes]

指定发送端的lane。

  • 可同时指定1个或多个lane,多个之间用逗号分开。
  • 若不指定,则默认测试所有lanes。
  • 本参数不支持与--show参数或--clear参数同时指定。

[--checker-pattern]

指定接受端的码流类型。

  • 当前支持校验的码流类型为:prbs7、prbs9、prbs10、prbs11、prbs15、prbs20、prbs23、prbs31。
  • 不指定该参数时,默认值为prbs31。
  • 指定码型时大小写均可生效,例如prbs7也可以写为PRBS7。
  • 本参数不支持与--show参数或--clear参数同时指定。

[--checker-lanes]

指定接收端的lane。

  • 可同时指定1个或多个lane,多个之间用逗号分开。
  • 若不指定,则默认测试所有lanes。
  • 本参数不支持与--show参数或--clear参数同时指定。

[-show, --show, --show diagnostic-info]

展示码流测试的结果。

  • 本参数不支持与以下参数同时指定:--clear、--prbs-mode、--generator-pattern、--generator-lanes、--checker-pattern、--checker-lanes。
  • 展示信息后当前码流测试的结果即会被清空。

[-clear, --clear, --clear-diagnostic-info]

清空码流测试的结果信息。

  • 本参数不支持与以下参数同时指定:--show、--prbs-mode、--generator-pattern、--generator-lanes、--checker-pattern、--checker-lanes。
  • 支持除以上参数外的其余参数同时指定。

[-fmt, --fmt, --format]

指定输出格式,可以为normal或json。若未指定则默认为normal。

[-h, --help]

显示帮助信息。

[-q, --quiet]

指定该参数,将不再进行防呆提示,用户将默认允许该操作。

若不指定该参数,将进行防呆提示,用户需要输入Y或N(y或n)确认是否进行测试。

使用实例

执行自定义打流时,请按照图3进行操作。

图3 码流测试流程图

在以上示例中,各回显参数的说明如表3所示:

表3 回显参数说明

参数

说明

Lane

对应RoCE链路的lane id。

Check Enable

接收端的check状态。

0:关闭

1:开启

Pattern

RX方向check的码型。

Error-Bits

误码数,上限为67092480(满误码)。

Bit-Error Rate(BER)

误码率,误码数÷总传输bit数×100%。

ALOS

正常打流时需要为0,为1通常表示信号幅度过低;

未打流时无意义无需关注。

Period

距离上一次操作控制打流/读取check结果的时间。

以下几种情况可能导致满误码(误码数为67092480):

  • 未使用--clear清空寄存器即进行码流测试。
  • 发送方向和接受方向指定的码型不一致。
  • 开关顺序问题:先开启了RX,后开启TX。
  • 打流流程会自动关闭NPU和CDR自适应,多次执行打流命令时会反复开关自适应,当自适应开关动作未完成时,偶现误码数为67092480。
  • CDR环回场景下,未配置CDR环回,详细配置步骤请参见。

后续操作