准备转储配置脚本
示例脚本 |
示例脚本说明 |
涉及日志文件 |
---|---|---|
ascend_log_rotate.sh |
日志转储脚本配置示例。用于配置训练容器内日志保存路径、宿主机挂载关系,以及启动其他日志采集脚本。 |
CANN应用类日志 CANN软件栈trace日志 CANN算子输入dump文件 CANN算子编译缓存文件 |
npu_info_collect.sh |
NPU环境检查脚本示例。通过执行hccn_tool、npu-smi等相关命令,记录软件版本信息、NPU网口指标、NPU状态等环境信息,如各NPU网口IP、收发报文统计、历史link统计、芯片健康等。 |
NPU环境检查文件 |
os_log_collect.py |
OS日志采集脚本示例。只将训练期间新产生的OS日志,转存至新的日志文件。注:该脚本无转储。 |
OS系统日志 |
将转储配置脚本示例文件,上传至计算节点任意目录,如“/var/log/ascend_log/script”,目录结构示例如下:
/var/log/ascend_log/script |—— ascend_log_rotate.sh |—— npu_info_collect.sh |—— os_log_collect.py
父主题: 训练任务日志采集配置