昇腾社区首页
中文
注册

功耗压测

测试项功能

进行EDP/TDP功耗压力测试,并输出诊断结果。

表1 诊断项说明

诊断项名称

参考耗时

是否影响NPU训练或推理

使用场景

TDP压测

默认20min

训练或推理业务上线。

EDP压测

默认5min

训练或推理业务上线。

测试项特定参数查询

各参数解释如表2所示,表格内仅展示测试项特定参数,其余公共参数请参见公共参数说明

表2 参数说明

参数

说明

是否必填

[-i, --items]

指定具体的压测检查项:
  • edp(Estimated Design Power):EDP功耗压力测试。
  • tdp(Thermal Design Power):TDP功耗压力测试。

[-st, --st, --stress-time]

指定EDP、TDP压力测试的时间。

  • 取值范围是[60,604800],单位为秒。
  • 需要在包含EDP、TDP压测检查项的场景下,与[-s, --stress]配合使用。

[--skip-check]

传入此参数时仅上报过温告警。

  • 仅支持items为edp或者tdp时,此参数才可使用。

使用实例

  • EDP功耗压测,以指定执行时长为300s为例:
    1
    2
    3
    4
    5
    6
    7
    8
    9
    [***@***]# ascend-dmi -dg -i edp -s -st 300 -q
    Summary:
        Arch: aarch64
        Mode: ******
        Time: 20250529-20:05:02
     
    Hardware:
        edp:
            PASS
    
  • TDP功耗压测,以指定执行时长为1200s为例:
    1
    2
    3
    4
    5
    6
    7
    8
    9
    [***@***]# ascend-dmi -dg -i tdp -s -st 1200 -q
    Summary:
        Arch: aarch64
        Mode: ******
        Time: 20250529-20:23:32
     
    Hardware:
        tdp:
            PASS
    

故障检查项说明

表3 故障检查项说明

回显状态

含义

PASS

功耗压力测试结果无异常。

SKIP

当前设备不支持功耗压测。

IMPORTANT_WARN

压测过程中产生芯片告警,请根据描述建议处理。若仍无法解决,请联系华为工程师处理。

FAIL

功耗压测功能执行失败,请联系华为工程师处理。