概述

使用约束

RPing功能特性当前版本仅支持 Atlas A2 训练系列产品

功能简介

RPing是一种基于RDMA的网络探测技术,昇腾AI软件栈提供了RPing功能相关接口供开发者调用,用以实现发送检测报文、记录网络时延、统计报文收发情况,从而帮助客户进行网络链路状态的监测。

RPing功能的实现示例流程如下所示:

图1 RPing功能实现流程

其中Host侧客户开发的应用程序作为控制端,Device侧的NPU即可以作为发送端(Client),又可以作为接收端(Target)。

RPing功能最终返回的探测结果包括收发端之间的网络时延(RTT)和收发包数量,其中网络时延RTT的计算方法如下:

RTT = (T4 - T1) - (T3 - T2)

时间戳T*的含义可参见图1