开发者
资源

在训练工程内开启Profiling采集功能

以下操作请在MindStudio环境上操作。

  1. 单击菜单栏File > Open...,选中迁移后的训练工程,如图1所示,单击“OK”导入工程。
    图1 导入训练工程
  2. 修改训练脚本。
    • 编辑resnet_run_loop.py文件,在主入口增加使能Profiling的逻辑,使得运行训练时开启Profiling,配置Profiling数据的落盘路径,以及需要采集的数据的开关项。如图2所示。
        custom_op = session_config.graph_options.rewrite_options.custom_optimizers.add()
        custom_op.name = 'NpuOptimizer'
        custom_op.parameter_map['profiling_mode'].b = True
        custom_op.parameter_map['profiling_options'].s = tf.compat.as_bytes('{"output":"/tmp/profiling",'
                                                                            '"training_trace":"on","task_trace":"on", '
                                                                            '"fp_point":"", "bp_point":"", '
                                                                            '"aic_metrics":"PipeUtilization"}')
      图2 使能Profiling
    • 为加快完成训练并采集Profiling数据,编辑cifar10_main.py,将train_epochs参数设置为1。
      图3 修改train_epochs参数
  3. 执行训练脚本,具体操作可参见分析迁移快速入门样例(TensorFlow GPU2Ascend)的“迁移后训练”章节。