带宽测试
测试项功能
带宽测试主要用于测试总线带宽、内存带宽。
测试项特定参数查询
用户可任选以下指令之一查看带宽测试命令的可用参数。
ascend-dmi --bw -h
ascend-dmi --bw --help
命令各参数解释如表1所示,表格内仅展示测试项特定参数,其余公共参数请参见公共参数说明。
参数 |
说明 |
约束 |
是否必填 |
---|---|---|---|
[-bw, --bw, --bandwidth] |
使用该参数测试芯片或整卡的带宽。 |
- |
是 |
[-t, --type] |
指测试数据流向的分类。
当使用带宽测试功能时,测试的数据流可以分为以下方向,若不填写数据流方向则默认返回h2d、d2h、d2d三个方向的带宽和总耗时。
|
|
否 |
[-m, --mode] |
指定带宽测试模式,执行卡粒度或芯片粒度的带宽测试。 不指定该参数时默认测试device粒度的带宽测试。
|
仅支持Atlas A3 训练及推理产品在type为p2p模式时,使用此参数。 |
否 |
[-s, --size] |
指传输数据大小并指定测试结果显示方式。
|
|
否 |
[-et, --et, --execute-times] |
指迭代次数,即内存拷贝次数。 取值范围为[1, 1000],若不填写,步长模式下拷贝次数默认为5,定长模式下拷贝次数默认为40。 |
|
否 |
[-d, --device] |
指定需要测试带宽的Device ID,Device ID是指昇腾AI处理器的逻辑ID。 若填写Device ID时:
若不填写Device ID时:
|
|
否 |
[-ds, --ds, --device-src] |
指定p2p测试的源头Device的ID号。必须与[-dd, --dd, --device-dst]参数成对指定,不支持单独使用,使用时参数后的数值不能相同;若与[-dd, --dd, --device-dst]参数同时不指定时,测试全量的昇腾NPU芯片。 |
|
否 |
[-dd, --dd, --device-dst] |
指定p2p测试的目标Device的ID号。必须与[-ds, --ds, --device-src]参数成对指定,不支持单独使用,使用时参数后的数值不能相同;若与[-ds, --ds, --device-src]参数同时不指定时,测试全量的昇腾NPU芯片。 |
|
否 |
注:
|
使用实例
一、以使用Atlas 800I A2 推理服务器,不带参数为例(不带参数则默认查询在Device 0,以h2d、d2h、d2d三个数据流向和步长模式显示的带宽耗时信息)。
ascend-dmi --bw -q
三、以使用Atlas 800I A2 推理服务器,测试数据从Device侧传输到同一Device侧的带宽与总耗时为例。
ascend-dmi --bw -t d2d -d 0 -q
- 以使用Atlas 800I A2 推理服务器,测试数据从源头Device 0传输到目标Device 1,执行次数为100,size为128M的p2p测试为例。
ascend-dmi --bw -t p2p --dd 0 --ds 1 --et 100 -s 134217728 -q
- 使用Atlas 800I A2 推理服务器,不指定源头Device和目标Device的p2p样例。
ascend-dmi --bw -t p2p -q
五、使用Atlas 900 A3 SuperPoD 超节点在p2p模式下,不指定源头Card和目标Card,指定了卡粒度的p2p样例。
ascend-dmi --bw -t p2p -q --mode card
若返回如下所示信息,表示工具运行正常。
[root@****]ascend-dmi --bw -t p2p -m card -q Unidirectional Peer to Peer Test Bandwidth Matrix(GB/s) C\C 0 1 2 3 4 5 6 7 0 *** 328.96 328.98 329.02 329.08 329.04 329.17 328.99 1 328.61 *** 328.58 328.56 328.48 328.55 328.53 328.57 2 328.57 328.49 *** 328.76 328.54 328.54 328.49 328.54 3 328.52 328.46 328.55 *** 328.72 328.50 328.54 328.54 4 329.02 329.05 328.99 329.03 *** 329.05 329.04 329.00 5 328.70 328.58 328.51 328.57 328.59 *** 328.56 328.56 6 328.56 328.53 328.63 328.58 328.61 328.57 *** 328.55 7 328.95 328.49 328.56 328.61 328.55 328.56 328.54 *** Bidirectional Peer to Peer Test Bandwidth Matrix(GB/s) C\C 0 1 2 3 4 5 6 7 0 *** 540.51 540.39 540.50 541.80 541.90 541.05 540.34 1 540.90 *** 540.90 541.05 541.48 540.53 559.08 540.56 2 540.95 541.40 *** 540.61 540.45 540.76 540.80 541.78 3 540.97 540.87 541.61 *** 541.41 540.35 540.90 540.98 4 541.30 541.04 540.82 542.88 *** 540.40 541.13 540.68 5 540.68 541.14 541.86 540.80 540.44 *** 540.80 540.36 6 540.54 540.91 540.98 541.03 540.63 541.20 *** 541.27 7 540.51 542.78 540.91 541.69 540.22 540.95 541.02 ***
参数 |
说明 |
---|---|
Host to Device Test |
带宽数据流方向。有以下显示可能:
|
Device X : Ascend XXX |
Device X为当前测试的设备ID,Ascend XXX为处理器类型。 0表示源头设备,1表示目标设备。 |
ID |
0:表示测试d2d、d2h、h2d模式下Device 0的带宽。 0→1表示测试Device 0到Device 1的单向P2P带宽。 0↔1表示测试Device 0和Device 1的双向P2P带宽。 |
Size(Bytes) |
传输数据大小,单位为字节。 |
Execute Times |
迭代次数 |
Bandwidth(GB/s) |
芯片的带宽 |
Elapsed Time(us) |
总执行时长 |
FAQ
- 带宽测试时间较长,测试结果未达到预期时可参考【D2D带宽】环境开启SWAP交换空间机制导致性能不达标。
- h2d带宽测试结果未达到预期时,建议在host侧修改Max Payload Size值为512B,具体操作可参考BIOS上设置Payload。
- Atlas 200T A2 Box16 异构子框执行p2p测试结果未达到预期时,可参考【P2P带宽】【Atlas 200T A2 Box16 异构子框】前8卡和后8卡间P2P带宽测试不达标。