昇腾社区首页
中文
注册

公共参数说明

功能命令的公共参数详情请见下表。

一级参数

二级参数

是否必填

说明

支持功能点

[-dg, --dg, --diagnosis]

[-dg, --dg, --diagnosis]

使用该参数进行整卡的故障诊断测试。

ascend-dmi --dg后使用-i,-r等多个二级参数时,可任意指定这些参数的排列顺序,不影响命令结果输出。

故障诊断:

  • 一键式组合诊断
  • CANN与驱动的兼容性诊断
  • 芯片诊断
  • 网络健康诊断
  • 片上内存诊断
  • 驱动健康诊断
  • 眼图诊断
  • 带宽诊断
  • NIC诊断
  • PRBS码流诊断
  • 算力诊断
  • AICORE压测
  • AICORE诊断
  • AICPU压测
  • 功耗压测
  • 一键式片上内存压测诊断
  • 片上内存压测
  • 片上内存高危地址压测
  • P2P压测

[-se, --scene, --se]

指定诊断场景。当前支持指定以下3个场景:

  • healthCheck(健康检查)
  • performanceCheck(性能规格)
  • stressTest(压测)

-

[-i, --items]

指定具体的诊断检查项:

  • 可指定driver、cann、device、network、bandwidth、aiflops、hbm/chipMemory、signalQuality中的一项或多项,多项时各项之间使用“,”分隔。
  • 不传入此参数,则默认执行除aicore、prbs、edp、tdp、aicpu、nic外其他检查项的诊断。
  • 当-i参数指定aicpu压测时,不支持与其他诊断项一起使用。

故障诊断:

  • CANN与驱动的兼容性诊断
  • 芯片诊断
  • 网络健康诊断
  • 片上内存诊断
  • 驱动健康诊断
  • 眼图诊断
  • 带宽诊断
  • NIC诊断
  • PRBS码流诊断
  • 算力诊断
  • AICORE压测
  • AICORE诊断
  • AICPU压测
  • 功耗压测
  • 一键式片上内存压测诊断
  • 片上内存压测
  • 片上内存高危地址压测
  • P2P压测

[-r, --result]

指定故障诊断结果和信息采集结果的保存路径,如:/test。指定的路径需符合安全要求,且不支持包含通配符“*”。

  • 若用户指定结果保存路径,则在指定路径创建ascend_check文件夹,root用户指定的路径,将创建在根目录下,非root用户则创建在其$HOME下;若不指定路径,则保存在默认路径下,root用户:“/var/log/ascend_check”,非root用户:“$HOME/var/log/ascend_check”。
  • 基于安全考虑,为防止结果保存目录权限被修改,用户可将结果保存目录ascend_check的权限设置为700。

故障诊断:

  • 一键式组合诊断
  • CANN与驱动的兼容性诊断
  • 芯片诊断
  • 网络健康诊断
  • 片上内存诊断
  • 驱动健康诊断
  • 眼图诊断
  • 带宽诊断
  • NIC诊断
  • PRBS码流诊断
  • 算力诊断
  • AICORE压测
  • AICORE诊断
  • AICPU压测
  • 功耗压测
  • 一键式片上内存压测诊断
  • 片上内存压测
  • 片上内存高危地址压测
  • P2P压测

[-s, --stress]

使用该参数进行压力测试。

使用右侧功能时该参数必选。

故障诊断:

  • AICORE压测
  • AICPU压测
  • 功耗压测
  • 一键式片上内存压测诊断
  • 片上内存压测
  • 片上内存高危地址压测
  • P2P压测

[-p, --path]

指定为功能项的安装路径。

  • 若用户安装软件包时未使用默认安装路径,则此参数必填,指定为实际安装路径。
  • 指定路径需符合安全要求,且不支持包含通配符“*”。
  • 若不填写,且为root用户安装软件包时,则取值为默认路径“/usr/local/Ascend”
  • 当[-i, --items]后检查项不包含cann时,用户请勿填写此参数。

信息查询:

  • 软硬件版本兼容性测试

故障诊断:

  • 一键式组合诊断
  • CANN与驱动的兼容性诊断

[-d, --device]

-

指定需要进行诊断测试的Device ID,Device ID是指昇腾芯片的逻辑ID。

  • 可指定一个或多个Device ID,多个时各项之间使用“,”分隔。
  • 不填写Device ID,除Atlas A3 训练系列产品、Atlas A3 推理系列产品外的其他产品在h2d/d2h/d2d模式下,带宽测试返回Device 0测试结果,其他场景返回所有Device的诊断结果。
  • 本文档输入或输出的Device ID都是芯片逻辑ID。用户可以执行npu-smi info -m命令,在显示界面表格中的Chip Logic ID参数处获得芯片逻辑ID,NPU ID则为对应的芯片物理ID。

性能测试:

  • 带宽测试
  • 超节点P2P带宽测试
  • 算力测试
  • 眼图测试
  • 码流测试(一键式打流、自定义打流)

故障诊断:

  • 芯片诊断
  • 网络健康诊断
  • 片上内存诊断
  • 眼图诊断
  • 带宽诊断
  • NIC诊断
  • PRBS码流诊断
  • 算力诊断
  • AICORE压测
  • AICORE诊断
  • AICPU压测
  • 一键式片上内存压测诊断
  • 片上内存压测
  • 片上内存高危地址压测
  • P2P压测

NPU环境恢复

[-fmt, --fmt, --format]

-

指定输出格式,可以为normal或json。

  • 若未指定则默认为normal。
  • 当测试项使用[-fmt, --fmt, --format]指定json格式输出时,会进行故障诊断结果保存,结果保存在“ascend_check/environment_check_before.txt”文件中,不指定json格式输出时,不保存故障诊断结果。
  • 当诊断项未通过时,返回的JSON回显示例请参见诊断项未通过时返回的JSON示例

- 所有功能

[-q, --quiet]

-

  • 指定该参数,将不再进行防呆提示,用户将默认允许该操作。该参数必须与-i参数的bandwidth、aiflops、hbm、aicore、prbs、tdp、edp、aicpu、nic一起使用。
  • 若不指定该参数,用户需要输入Y或N(y或n)确认是否进行测试。

性能测试:

  • 带宽测试
  • 超节点P2P带宽测试
  • 功耗测试
  • 算力测试
  • 码流测试(一键式打流、自定义打流)

故障诊断:

  • 一键式组合诊断
  • 带宽诊断
  • NIC诊断
  • PRBS码流诊断
  • 算力诊断
  • AICORE压测
  • AICORE诊断
  • AICPU压测
  • 功耗压测
  • 一键式片上内存压测诊断
  • 片上内存压测
  • 片上内存高危地址压测
  • P2P压测

NPU环境恢复

[-h, --help]

-

查看Ascend DMI工具指定功能的帮助信息。

- 所有功能