检测设备在运行过程中的状态信息。
以下为各类服务器返回的查询芯片的详细信息示例,如返回对应信息表示工具运行正常。
以上图中各类服务器参数介绍如表2所示。
参数 |
说明 |
产品形态 |
---|---|---|
Type |
芯片型号 |
训练服务器 |
NPU Count |
NPU数量 |
|
Card Quantity |
卡数量 |
标卡 |
Type |
标卡型号 |
|
Card Manufacturer |
卡生产商 |
|
Card Serial Number |
卡序列号 |
|
Card ID |
卡ID号 |
|
Real-time Card Power (W) |
卡实时功耗 |
|
Device Count |
设备数(NPU个数) |
|
Chip Name |
芯片名称 |
标卡、训练服务器 |
Device ID |
芯片逻辑ID号 |
|
Chip ID |
芯片ID号 |
|
DIE ID |
芯片的DIE ID |
|
AI Core Information |
AI Core信息。包括以下信息:
|
|
CPU Information |
CPU信息。包括以下信息:
|
|
Memory Information |
内存信息。包括以下信息:
|
|
Power Information |
功耗信息。包括以下信息:
|
|
Temperature (C) |
芯片温度 |
|
voltage(V) |
电压信息(V) |
|
health |
健康信息 |
|
PCIe Information |
PCIe信息。包括以下信息:
|
|
Error Information |
错误信息 |
|
Error Count |
错误个数 |
|
ECC Information |
ECC信息 |
|
DDR |
卡的内存类型,有以下四种内存类型显示可能:
本项显示中包括以下信息:
|
标卡、训练服务器 (Atlas A2 训练系列产品上不支持查询该结果) |
执行ascend-dmi -i --dt命令时,可能会出现以下情况:
以下为各类服务器返回的查询芯片的基本信息示例,如返回对应信息表示工具运行正常。
以上图中各类服务器参数介绍如表3所示。
参数 |
说明 |
产品形态 |
---|---|---|
Type |
标卡型号 |
标卡 |
Card |
卡ID号 |
|
NPU Count |
NPU的个数 |
|
Real-time Card Power |
当前板卡的实际功耗 |
|
Chip |
芯片编号 |
|
Name |
芯片名称 |
|
Type |
芯片型号 |
训练服务器 |
NPU Count |
NPU数量 |
|
Chip Name |
芯片名称 |
|
Power |
功耗 |
|
Health |
芯片健康程度 |
标卡、训练服务器 |
Used Memory |
内存使用信息 |
|
Temperature |
芯片当前温度 |
|
Voltage |
芯片当前电压 |
|
Device ID |
芯片逻辑ID号 |
|
Bus ID |
PCIe总线地址 |
|
AI Core Usage |
芯片AI Core的使用率 |