功耗测试是通过运行单算子模型来检测整卡的功耗信息。
功耗测试支持的设备及场景如表1 支持的场景和产品型号所示。(在下表中,Y表示支持,N表示不支持。)
场景/产品型号 |
|
|
|
|
|
|
---|---|---|---|---|---|---|
物理机 |
Y |
Y |
Y |
Y |
||
宿主机+容器 |
Y |
Y |
N |
Y |
N |
|
虚拟机 |
N |
N |
N |
用户可任选以下指令之一查看功耗测试命令的可用参数。
ascend-dmi -p -h
ascend-dmi -p --help
各参数解释如表2所示。
参数 |
说明 |
是否必填 |
---|---|---|
[-p, --power] |
使用该参数进行整卡的功耗测试。 |
是 |
[-t, --type] |
指定算子运算类型,可以为fp16或int8,若未指定则默认为fp16。 其中Atlas A2 训练系列产品只支持指定为fp16。 |
否 |
[-pt, --pt, --pressure-type] |
使用该参数指定压力测试的类型。
|
否 |
[-dur, --dur, --duration] |
指运行时间,若不填写运行时间则默认为600。 单位为秒,取值范围为[60,604800]。 |
否 |
[-it, --it, --interval-times] |
指屏幕信息打印刷新的间隔时间,若不填写间隔时间则默认为5。 单位为秒,取值范围为[1, 5]。 |
否 |
[--skip-check] |
传入此参数时会跳过设备健康状态检查。 不传入此参数,默认会进行设备健康状态检查。 |
否 |
[-pm, --pm, --print-mode] |
屏幕输出的打印模式,若不填写打印模式则默认为refresh。 打印模式:
|
否 |
[-q, --quiet] |
指定该参数,将不再进行防呆提示,用户将默认允许该操作。
说明:
若不指定该参数,将进行防呆提示,用户需要输入Y或N(y或n)确认是否进行测试。 |
否 |
[-h, --help] |
查看Ascend DMI工具“功耗测试”功能的帮助信息。 |
否 |
以下为各类服务器返回的功耗示例。
以执行时间为60s,信息的打印间隔信息为5s,屏幕的输出模式为清除历史记录为例。
ascend-dmi -p --dur 60 --it 5 --pm refresh
以执行时间为60s,信息的打印间隔信息为5s,屏幕的输出模式为清除历史记录为例。
ascend-dmi -p --dur 60 --it 5 --pm refresh
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 |
|=======================+==================+=======================| | Type | NPU Count | +-----------------------+------------------+-----------------------+ | Device ID | Health | Temperature Voltage | | Chip Name | AI Core Usage | Power Frequency| |=======================+==================+=======================| | Ascend *** | 8 | +-----------------------+------------------+-----------------------+ | 0 | OK | 49C 0.79V | | Ascend *** | 100% | 350.1W 1500MHZ | +-----------------------+------------------+-----------------------+ | 1 | OK | 55C 0.79V | | Ascend *** | 100% | 350.4W 1550MHZ | +-----------------------+------------------+-----------------------+ | 2 | OK | 50C 0.78V | | Ascend *** | 100% | 349.9W 1600MHZ | +-----------------------+------------------+-----------------------+ | 3 | OK | 55C 0.78V | | Ascend *** | 100% | 350.0W 1550MHZ | +-----------------------+------------------+-----------------------+ | 4 | OK | 49C 0.77V | | Ascend *** | 100% | 350.2W 1500MHZ | +-----------------------+------------------+-----------------------+ | 5 | OK | 54C 0.77V | | Ascend *** | 100% | 350.1W 1500MHZ | +-----------------------+------------------+-----------------------+ | 6 | OK | 49C 0.78V | | Ascend *** | 100% | 349.8W 1550MHZ | +-----------------------+------------------+-----------------------+ | 7 | OK | 53C 0.75V | | Ascend *** | 100% | 350.2W 1600MHZ | |=======================+==================+=======================| |
上述图中各类服务器参数介绍如表3所示。