昇腾社区首页
中文
注册

硬件压测

对于一些大集群的任务,需优先采用硬件压测,排除精度异常节点,压测按如下步骤进行:

  1. 模型压测:使用分组的单机或多机任务训练找到与其他大部分卡或机器精度不一致的机组
  2. 命令压测:使用ascend-dmi命令进行压测,命令如下:
    ascend-dmi -dg -i aicore -s -sc 60 -q