日志文件清单 日志目录 转储优先级 日志流量(每节点8卡) 日志说明 日志默认路径 日志路径配置方式 参考文档 NPU Device侧日志目录 必选 1.6MB/小时或38.4MB/天 包括slog日志、syslog日志、黑匣子、Stackcore文件和事件调度模块的维测信息 默认落盘在NPU Device侧,需要通过msnpureport工具导出 通过msnpureport工具或msnpureport_auto_export.sh脚本导出。 《msnpureport工具使用》 CANN应用类日志目录 必选 4MB/小时或96MB/天 包括Host侧应用类日志和Device侧应用类日志 Host侧应用类日志:如compiler中各组件(如GE、FE、AI CPU、TBE、HCCL等)、runtime中各组件(如AscendCL、GE、Runtime等)和Driver用户态日志。以“plog-pid”为开头命名的日志文件Device侧应用类日志:如AI CPU、HCCP等模块的日志。以“device-pid”为开头命名的日志文件 $HOME/ascend/log/ 通过ASCEND_WORK_PATH或ASCEND_PROCESS_LOG_PATH环境变量指定 《CANN 日志参考》中的“查看日志(Ascend EP标准形态)”章节 CANN软件栈trace日志目录 必选 最大110MB/训练主进程 trace日志。在程序运行过程中,先将软件栈的trace信息记录在内存中,当程序运行出错时落盘到文件 $HOME/ascend/atrace/ 通过ASCEND_WORK_PATH环境变量指定 《CANN 日志参考》中的“查看trace日志”章节 CANN算子输入dump文件目录 可选 - 异常算子的输入数据 $ASCEND_WORK_PATH/extra-info/data-dump 通过ASCEND_WORK_PATH环境变量指定。同时需配置参数“enable_exception_dump”取值为“2”且未配置环境变量“NPU_COLLECT_PATH”。 《msnpureport工具使用》 https://www.hiascend.com/document/detail/zh/canncommercial/80RC1/apiref/envvar/envref_07_0007.html 《CANN 环境变量参考》中的“安装配置相关”>“落盘文件配置”>“ASCEND_WORK_PATH”章节 CANN算子编译缓存文件目录 可选 - 各组件编译运行过程中产生的可共享文件 ${HOME}/atc_data 通过ASCEND_CACHE_PATH环境变量指定 《msnpureport工具使用》 用户训练日志目录 必选 5KB/训练主进程 由用户训练脚本产生的终端打屏日志。一般与用户训练代码产生的打屏日志一起,由用户重定向到本地存储。MindSpore或PyTorch Adapter主要运行出错时记录日志,错误日志平均每个进程约5KB 用户配置 训练脚本重定向 N/A NPU环境检查文件目录 可选 500KB 通过npu-smi、hccn_tool等命令查询NPU环境状态,并将查询结果重定向 用户配置 ${存储侧训练日志存储目录}/app_log/${job_id}/${node_id}/environment_check NPU环境检查脚本 OS系统日志目录 可选 - OS系统日志 Host驱动日志: “/var/log/syslog*” Host内核态日志: “/var/log/messages*” “/var/log/kern.log*” “/var/log/kernel.log*” “/var/log/dmesg*” - - 父主题: 日志转储方案参考