昇腾社区首页
中文
注册

NPU Device侧日志采集配置

执行NPU Device侧日志采集配置主要用于指定NPU Device侧日志的保存目录。

在计算节点的宿主机创建目录,用于存放NPU Device日志。

mkdir -p ${Device日志存储目录}

使用msnpureport_auto_export.sh文件脚本,周期性导出Device侧日志。

Driver安装目录/driver/tools/msnpureport_auto_export.sh {采集间隔时间} {最大存储目录容量} /{Device日志存储目录名}
示例:
/bin/bash /usr/local/Ascend/driver/tools/msnpureport_auto_export.sh 300 10 /ascend_cluster_log/device_log/

在以上示例中,采集间隔时间等参数说明如下:

表1 参数说明

参数

说明

采集间隔时间

导出Device侧日志和文件的间隔时间。取值为大于0的整数,单位是s,如:2s。

最大存储目录容量

导出Device侧日志和文件的存储目录容量。取值为大于等于2的整数,单位是G,如:10G。

Device日志存储目录名

导出Device侧日志和文件的存储路径(任意的绝对路径)。如:“/home/log/”。

  • msnpureport_auto_export.sh脚本的更多使用指导请参见《Atlas A2 中心推理和训练硬件 24.1.0 黑匣子日志参考》的“连续导出Device侧的日志和文件”章节
  • 若设置采集间隔时间较短,频繁导出日志可能会导致系统资源开销较大,推荐参数设置为300(5分钟),可根据实际场景调整。
  • 训练服务器开机后,只需执行一次msnpureport_auto_export.sh脚本。训练服务器重启后,也需要重新执行该采集脚本,建议作成开机自启动脚本。