创建日志目录
在对应节点创建组件日志父目录和各组件的日志目录,并设置目录对应属主和权限。
操作步骤
- 执行以下命令,按照表1 集群调度组件日志路径列表,在各节点创建组件日志父目录。
mkdir -m 755 /var/log/mindx-dl chown root:root /var/log/mindx-dl
- 根据所使用组件的具体情况,创建相应的日志目录。
表1 集群调度组件日志路径列表 组件
创建日志目录命令
日志路径创建节点
说明
Ascend Device Plugin
mkdir -m 750 /var/log/mindx-dl/devicePlugin chown root:root /var/log/mindx-dl/devicePlugin
计算节点
-
NPU Exporter
mkdir -m 750 /var/log/mindx-dl/npu-exporter chown root:root /var/log/mindx-dl/npu-exporter
NodeD
mkdir -m 750 /var/log/mindx-dl/noded chown root:root /var/log/mindx-dl/noded
Elastic Agent
mkdir -m 750 /var/log/mindx-dl/elastic chown 由用户自行定义 /var/log/mindx-dl/elastic
说明:将Elastic Agent日志目录挂载到容器内,详见配置YAML章节。
- 目录属主由用户自定义。注意:安装Elastic Agent的用户属组、调用Elastic Agent的运行用户属组、挂载宿主机的目录属组请保持一致。
- 用户可自定义Elastic Agent的运行日志的落盘路径,在该路径下,用户可查看Elastic Agent所有节点日志,无需逐一登录每个节点查看。自定义配置Elastic Agent运行日志的落盘路径的详细步骤可参考步骤6。
TaskD
mkdir -m 750 训练脚本目录/taskd_log chown 由用户自行定义 训练脚本目录/taskd_log
- 目录属主由用户自定义。
- TaskD在运行过程中可以自动创建对应日志目录,日志目录前缀一般为任务YAML中执行bash命令或拉起训练时所在目录。
Ascend Operator
mkdir -m 750 /var/log/mindx-dl/ascend-operator chown hwMindX:hwMindX /var/log/mindx-dl/ascend-operator
管理节点
-
Resilience Controller
mkdir -m 750 /var/log/mindx-dl/resilience-controller chown hwMindX:hwMindX /var/log/mindx-dl/resilience-controller
ClusterD
mkdir -m 750 /var/log/mindx-dl/clusterd chown hwMindX:hwMindX /var/log/mindx-dl/clusterd
Volcano
mkdir -m 750 /var/log/mindx-dl/volcano-controller chown hwMindX:hwMindX /var/log/mindx-dl/volcano-controller
mkdir -m 750 /var/log/mindx-dl/volcano-scheduler chown hwMindX:hwMindX /var/log/mindx-dl/volcano-scheduler
父主题: 安装前准备