适配训练脚本
配置训练脚本,以将训练日志重定向至指定目录。以训练脚本train.py为例,执行参考样例如下:
python train.py &> "${TRAIN_LOG_DIR}/rank-{npu id}.log" wait

- pytorch框架下npu id可使用all代替,如rank-all.log
- mindspore框架下npu id可使用NPU卡号代替,如rank-0.log
- wait表示等待训练进程后台执行结束
父主题: 训练任务日志采集配置