ascend-dmi工具的设备拓扑检测功能将于后续版本退出,用户可以使用npu-smi工具进行设备拓扑检测,具体使用方法请参见《npu-smi 命令参考》的“查询多NPU的拓扑结构”章节。
设备拓扑检测是查询单机内多卡间的拓扑结构。
用户可任选以下指令之一查看设备拓扑检测命令的可用参数。
ascend-dmi --topo -h
ascend-dmi --topo --help
各参数解释如表1所示。
参数
说明
是否必填
[-topo, --topo, --topology]
查看单机内多卡间的拓扑结构。支持-topo,但建议使用--topo或--topology。
是
[-fmt, --fmt, --format]
指定输出格式,可以为normal或json。若未指定则默认为normal。
否
使用实例中命令的回显在推理服务器与训练服务器上类似,截图取自推理服务器。
ascend-dmi --topo
若返回如图1所示信息,表示工具运行正常,图中参数请参见表2。
ascend-dmi --topo --fmt json
NPUx
服务器安装的NPU,x为NPU的ID。
SYS
在不同的NUMA node下面,且2个node之间使用的是SMP类协议的芯片。
PHB
通过PCIe连接在同一个CPU上的,且需要经过CPU。
PIX
通过PCIe连接在同一个CPU上的,不需要经过CPU,且穿过1个PCIe switch。
HCCS
通过HCCS连接。
CPU Affinity
一个NUMA node下的Device和CPU具有亲和性。
以图1中的CPU Affinity为例,0-3表示CPU0到CPU3,8-11表示CPU8到CPU11,NPU和以上8个CPU都具有亲和性。