asys工具使用指导(EP模式)

前提条件

已在CANN运行环境上安装toolkit包。详细安装请参见CANN 软件安装指南

在使用asys工具前,需要以安装时的运行用户登录环境,执行source ${install_path}/latest/bin/setenv.bash命令设置环境变量,然后直接输入asys命令符,不用带asys工具完整路径的命令方式(即python3 ${install_path}/latest/toolkit/tools/ascend_system_advisor/asys/asys.py)。其中${install_path}为软件包的安装目录,例如:/usr/local/Ascend/ascend-toolkit。

故障信息收集

业务复跑+故障信息收集

业务复跑默认开启算子编译文件、GE dump图和TF Adapter dump图收集功能。本工具内部会通过环境变量NPU_COLLECT_PATH指定的路径来收集dump图及算子编译.o文件,不需要用户指定NPU_COLLECT_PATH环境变量值,该场景下,收集的是L1 exception dump信息。

软硬件、Device状态信息展示

健康检查

综合诊断

综合检测相关命令必须在物理机且root用户下执行,且该功能涉及执行算子,因此环境中需提前安装算子二进制文件包(包名为Ascend-cann-kernels-*_linux.run)。

同时仅以下产品支持使用综合检测功能:

Atlas A2训练系列产品/Atlas 800I A2推理产品

trace/coredump/stackcore文件解析

FAQ