在训练工程内开启Profiling采集功能
以下操作请在MindStudio环境上操作。
- 单击菜单栏,选中迁移后的训练工程,如图1所示,单击“OK”导入工程。
- 修改训练脚本。
- 编辑resnet_run_loop.py文件,在主入口增加使能Profiling的逻辑,使得运行训练时开启Profiling,配置Profiling数据的落盘路径,以及需要采集的数据的开关项。如图2所示。
custom_op = session_config.graph_options.rewrite_options.custom_optimizers.add() custom_op.name = 'NpuOptimizer' custom_op.parameter_map['profiling_mode'].b = True custom_op.parameter_map['profiling_options'].s = tf.compat.as_bytes('{"output":"/tmp/profiling",' '"training_trace":"on","task_trace":"on", ' '"fp_point":"", "bp_point":"", ' '"aic_metrics":"PipeUtilization"}') - 为加快完成训练并采集Profiling数据,编辑cifar10_main.py,将train_epochs参数设置为1。
图3 修改train_epochs参数
- 编辑resnet_run_loop.py文件,在主入口增加使能Profiling的逻辑,使得运行训练时开启Profiling,配置Profiling数据的落盘路径,以及需要采集的数据的开关项。如图2所示。
- 执行训练脚本,具体操作可参见《分析迁移快速入门样例(TensorFlow GPU2Ascend)》的“迁移后训练”章节。
父主题: 性能分析(TensorFlow训练)

