日志采集目录结构

本章节介绍待清洗的目录结构组成,用户可参照以下内容进行日志收集,并按对应结构存储。

  • Ascend-fd parse输入目录的日志文件大小会影响执行清洗命令的效率,总文件大小应限制在5G以下,文件总数量不能超过1000000。
  • CANN应用类日志的单个文件应限制在20MB以下。
  • NPU状态监测指标文件、NPU网口统计监测指标文件、主机侧资源信息文件应限制在512MB以下。
  • 用户训练及推理日志大小无限制,会默认只读最后1MB日志。
  • Host OS系统日志当前支持messages、dmesg、vmcore_dmesg.txt和sysmonitor.log日志,其中单个文件的转储大小上限请限制在512MB以下;dmesg日志取最新的日志,最大100000行。
  • process_log、environment_check、device_log、dl_log、mindie、amct_log位置不受约束,存放在采集目录下任意位置均可。
  • 用户若在容器中进行训练及推理,请及时保存日志至宿主机,如用户训练及推理日志、CANN应用类日志。
  • 训练及推理前或后NPU环境检查文件、NPU网口统计监测指标文件、NPU状态监测指标文件、主机侧资源信息、主机侧操作系统日志和Device侧日志、MindCluster组件日志、MindIE组件日志、AMCT组件日志请在宿主机上采集。
  • Volcano组件中volcano-scheduler与volcano-controller触发转储后以gzip压缩的转储日志将不会被读取,采集时需确保相关日志都已在未转储的volcano-scheduler.log与volcano-controller.log中。