昇腾社区首页
中文
注册

asys工具功能及约束

功能介绍

为提高系统故障维测效率,提供故障收集工具asys一键式收集故障信息,支持以下功能:

  • 业务复跑+故障信息收集:一次性复跑业务并收集故障信息,提高故障问题复现以及收集信息效率。
  • 仅收集故障信息:一次性收集进程故障现场信息,,为故障定位效率提升提供有效输入。
  • 仅收集软硬件信息:收集安装包版本信息、硬件信息、Device健康状态信息等。
表1 asys工具支持收集的信息列表

分类

描述

软件信息

涉及软件包版本,环境变量,软件依赖,系统信息。

日志信息

包括以下信息:

  • Host侧CANN软件栈日志。
  • Host侧message日志。
  • Device侧固件日志:device-*日志(需root权限)
  • Device侧系统日志:message日志,device-os日志(需root权限)。
  • 黑匣子、Stackcore文件(需root权限)
  • 任务打屏日志。
  • run包安装日志(需run包安装帐号与应用程序执行帐号一致才可收集)。

dump信息

包括以下信息:

  • GE dump图。
  • TF Adapter dump图。
  • 发生Ai Core Error时生成的dump文件。

算子编译*.o、*.json文件

-

用户用例执行的命令信息

-

调试版本的二进制信息

即$ASCEND_OPP_PATH/debug_kernel目录下的信息,但需提前配置环境变量$ASCEND_OPP_PATH(表示算子库的安装目录)。若未配置$ASCEND_OPP_PATH环境变量或该环境变量配置不正确,则默认不收集调试版本的二进制信息。

使用约束

  1. 相同用户、相同时间段内,同机器同时作业时,收集到的数据会有交叉。
  2. 非root用户,获取到的数据范围会受限,具体限制参考功能介绍处的权限要求。
  3. 集群、容器、虚拟机、云场景不支持一键式工具收集故障信息。
  4. asys工具涉及大量维测信息的收集,因此涉及内存占用,不建议多进程并行执行,否则可能导致asys工具执行出错或环境异常。
  5. 该工具不支持RC模式。