使用msaicerr工具分析AI Core Error问题
msaicerr工具的功能及约束请参见msaicerr工具功能及约束,环境准备请参见msaicerr工具环境准备。
操作步骤
- 以运行用户登录Host服务器。
- 使用msaicerr工具快速定位AI Core Error问题的关键原因。
进入“${Toolkit包安装路径}/tools/msaicerr”目录,根据收集AI Core Error问题信息中收集的信息,执行以下命令提取AI Core Error问题相关的关键信息。以下命令中aic_err_info_timestamp为存放AI Core Error问题信息的目录,请根据实际情况替换。
python3 msaicerr.py -p ${HOME}/aic_err_info_timestamp -out $HOME/result以上命令示例中,通过-p参数指定存放故障信息的目录,例如此处为${HOME}/aic_err_info_timestamp;通过-out参数指定解析结果文件的存放路径,例如此处为$HOME/result,如果不指定,则解析结果默认存放在执行命令的当前路径下。
注意:不能进入-p参数指定的目录或子目录下执行msaicerr工具,例如此处不能进入到aic_err_info_timestamp目录或其子目录中执行msaicerr工具;-out参数指定的目录也不能为-p参数指定的目录或子目录。否则,会出现工具解析卡住或失败的情况。
执行命令后,用户根据终端界面提示的info.txt文件所在的路径,通过info.txt文件中的提示信息进行问题分析和定位,重点关注下表所示的关键信息。若收集AI Core Error问题信息中收集的信息中存在多个AI Core Error问题,则msaicerr工具按日志时间解析第一次出现的AI Core Error问题。
若执行msaicerr工具失败:- 检查使用工具的前提条件是否满足、收集AI Core Error问题信息中收集的信息是否完整;
- 再参见算子输入args错误排查算子参数问题;
- 如果无法定位问题,您可以获取日志后单击Link联系技术支持。
父主题: AI Core Error问题定位专题